和 计 ， 外 ”机 1 科 轩 | 学 .人 书 K 外 
0 


华章 教育 


?了 Pearson 


Go 程序 议 计 1 
父 伦 A. A. 多 席 万 (AlanA.A. Donovan ) 
[ 美 ] 谷 驶 公司 
布 落 恩 W. 柯 尼 汉 (Brian W. Kernighan ) 
普林斯顿 大 学 
本 道 兵 高 博 庞 向 才 金 侈 佬 林 齐 斌 译 


A 


® 
| 











The Go Programming Language 





he IC | 人 
Procraitamallg 
Language 


Alan A. A. Donovan 
Brian W. Kernighan 








全 ) 机 械 工业 出 版 社 


China Machine Press 








， i 艾 伦 A. A. 多 诺 万 (Alan A.A. Donovan ) 
de I 

， 布 莱 恩 W. 柯 尼 汉 (Brian W. Kernighan ) 
“”“”“” 普林斯顿 大 学 


李 道 兵 高 博 庞 向 才 金 奢 您 林 齐 斌 译 











The Go Programming Language 
























D 抽 碟 工业 出 | 


China Machine Press ， 





图 书 在 版 编目 (CIP ) 数据 


Go 程序 设计 语言 / ( 美 ) 艾 伦 A. A. 多 诺 万 ( Alan A. A. Donovan)，( 美 ) 布 莱 恩 W. 柯 尼 
汉 (Brian W. Kernighan) 著 ; 李 道 兵 等 译 . 一 北京 : 机 械 工业 出 版 社 ，2017.1 
(计算 机 科学 丛书 ) 

书 名 原文 : The Go Programming Language 





ISBN 978-7-111-55842-2 
I. G… JI.@ 艾 … @@ 布 … @ 李 … III.C 语言 -程序 设计 IV. TP312.8 
中 国 版 本 图 书馆 CIP 数据 核 字 ( 2017 ) 第 011442 号 





本 书 版 权 登 记号 : 图 字 : 01-2015-7914 


Authorized translation from the English language edition, entitled The Go Programming 
Language, 978-0-13-419044-0, by Alan A. A. Donovan, Brian W. Kernighan, published by 
Pearson Education, Inc., Copyright © 2016 Alan A. A. Donovan & Brian W. Kernighan. 

All rights reserved. No part of this book may be reproduced or transmitted in any form 
or by any means, electronic or mechanical, including photocopying, recording or by any 
information storage retrieval system, without permission from Pearson Education, Inc. 

Chinese simplified language edition published by Pearson Education Asia Ltd., and 
China Machine Press Copyright © 2017. 

本 书 中 文 简体 字 版 由 Pearson Education ( 培 生 教育 出 版 集团 ) 授权 机 械 工 业 出 版 社 在 中 华人 民 共 
和 国境 内 (不 包括 香港 、 澳 门 特别 行政 区 及 台湾 地 区 ) 独家 出 版 发 行 。 未 经 出 版 者 书面 许可 ， 不 得 以 任 
何方 式 抄 袭 、 复 制 或 节录 本 书 中 的 任何 部 分 。 

本 书 封底 贴 有 Pearson Education ( 培 生 教育 出 版 集团 ) 激光 防伪 标签 ， 无 标签 者 不 得 销售 。 





本 书 由 《 C 程序 设计 语言 》 的 作者 Kernighan 和 谷歌 公司 Go 团队 主管 Alan Donovan 联 被 撰写 ， 
是 学 习 Go 语言 程序 设计 的 权威 指南 。 本 书 共 13 章 ， 主 要 内 容 包括 : Go 的 基础 知识 、 基 本 结构 、 基 本 
数据 类 型 、 复 合 数据 类 型 、 函 数 、 方 法 、 接 口 、goroutine、 通 道 、 共 享 变量 的 并 发 性 、 包 、go 工具 、 
测试 、 反 射 等 。 

本 书 适 合作 为 计算 机 相关 专业 的 教材 ， 也 可 供 Go 语言 爱好 者 阅读 。 


出 版 发 行 : 机 械 工 业 出 版 社 (北京 市 西城 区 百 万 庄 大街 22 号 ”邮政 编码 100037 ) 


责任 编辑 : 谢 晓 芳 责任 校对 : 董 纪 丽 

印 刷 : 北京 市 荣 盛 彩色 印刷 有 限 公 司 版 ”次 : 2017 年 4 月 第 1 版 第 1 次 印刷 
开 本 : 185mm x260mm 1/16 印张 : 18.75 

书 ” 号: ISBN 978-7-111-55842-2 定 价 : 79.00 元 








凡 购 本 书 ， 如 有 缺 页 、 倒 页 、 脱 页 ， 由 本 社 发 行 部 调换 
客服 热线 : (010) 88378991 88361066 投稿 热线 : (010 ) 88379604 
购书 热线 : (010 ) 68326294 88379649 68995259 读者 信箱 : hzjsj@hzbook.com 


版 权 所 有 “ 侵权 必 究 
封底 无 防伪 标 均 为 盗版 
本 书法 律 顾问 : 北京 大 成 律师 事务 所 韩 光 / 邹 晓 东 





| 出 版 者 的 话 


The Go Programming Language 





文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 各 
个 领域 取得 了 化 断 性 的 优势 ,也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 家 辈 
出 、 独 领 风骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧 密 地 结合 ， 计 算 机 学 科 中 
的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 壁 划 了 研究 
的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 因 年 月 的 流 
逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 寡 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 日 益 
迫切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ， 而 专业 教材 的 建设 在 教育 战略 上 显 
得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国 家 在 其 计算 机 科学 发 展 的 
几 十 年 间 积淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计算 机 教材 
将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 的 世界 一 流 
大 学 的 必由之路 。 

机 械 工业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 ” 。 自 1998 年 开始 ， 我 们 就 将 工 
作 重 点 放 在 了 六 选 、 移 译 国外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson，McGraw- 
Hil，Elsevier，MIT，John Wiley & Sons，Cengage 等 世界 著名 出 版 公司 建立 了 良好 的 合作 关 
系 ， 从 他 们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum，Bjarne Stroustrup，Brian W. 
Kernighan, Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft，Jeffrey D. Ullman, 
Abraham Silberschatz, William Stallings, Donald E. Knuth, JohnL. Hennessy, Larry L. Peterson 
等 大 师 名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 究 及 珍藏 。 
大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 从 书 的 品位 和 格调 。 

“计算 机 科学 从 书 ” 的 出 版 工作 得 到 了 国内 外 学 者 的 鼎力 相助 ， 国 内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ， 而 原 书 的 作者 也 相当 关注 其 作品 在 中 
国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书” 已 经 出 版 了 近 两 百 个 
品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 。 其 影 
印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 图 
书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建设 的 不 断 完善 和 教材 改革 的 逐渐 深化 ， 
教育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 和 一 个 新 的 阶段 ， 我 们 的 目标 是 尽善尽美 ， 而 反 
馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公 司 欢迎 老师 和 读者 对 我 们 的 工作 提出 
建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 : www.hzbook.com Eee 
电子 邮件 : hzjsj@hzbook.com | 主 
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很 高 兴 这 次 应 高 博 的 邀请 ， 与 高 博 及 上 海 七 牛 信息 技术 有 限 公司 的 几 位 同事 一 起 来 完成 
本 书 的 翻译 。 

Go 语言 在 2009 年 发 布 ， 当 年 就 被 选 为 TIOBE 年 度 语 言 ， 并 在 若干 年 后 的 今天 ， 再 度 
当选 为 TIOBE 年 度 语 言 。 这 有 力 证 明了 Go 语言 在 工业 界 和 开发 者 社区 的 良好 口碑 ， 以 及 
与 时 俱 进 的 生命 力 。 本 书简 体 中 文 版 的 出 版 ， 可 谓 恰 逢 其 时 ! 

2012 年 ，Go 语言 发 布 1.0 版 本 后 ， 推 广 速度 更 是 突飞猛进 ， 比 如 最 好 的 容器 软件 
Docker 就 是 用 Go 语言 写成 的 ，ETCD 、Kubernetes 这 类 有 望 构 建新 一 代 软 件 架构 的 基础 软 
件 也 是 基于 Go 语言 的 。 除 此 之 外 ， 数 据 库 领域 有 TiDB 和 InfluxDB， 消 息 系统 有 NSQ,， 绥 
存 系统 有 GroupCache。 可 以 看 到 ， 几 乎 在 基础 架构 软件 的 每 一 个 领域 ， 都 涌现 了 由 Go 语言 
编写 的 新 软件 ， 这 些 软件 已 经 取得 或 者 正在 取得 越 来 越 高 的 市 场 占 有 率 。 除 了 作为 基础 架构 
软件 的 语言 之 外 ，Go 语言 作为 服务 器 端 通用 语言 的 机 会 也 越 来 越 多 ， 这 从 Beego、Gorilla 
等 Go 语言 Web 框架 的 热门 程度 也 可 以 看 出 一 些 端倪 。 

在 基础 架构 软件 这 个 层面 ， 最 早 只 有 C 语言 ， 后 来 又 有 了 C++ 语言 。 在 性 能 不 受 影响 
的 情况 下 ，C++ 语言 让 我 们 得 以 驾驭 规模 更 大 、 更 复杂 的 项 目 ， 比 如 MySQL、MongoDB 
这 类 数据 库 软 件 就 是 用 C++ 语言 写 的 。 尽 管 C++ 语言 功能 强大 ， 但 是 它 并 没有 太 好 地 解 
决 代码 的 易 用 性 和 健壮 性 互相 平衡 的 问题 ， 所 以 我 们 接 下 来 看 到 了 很 多 基于 Java 语言 的 基 
础 架构 软件 的 出 现 ， 例 如 整个 Hadoop 生态 。 在 这 之 后 ， 随 着 高 并 发 需求 的 逐步 增强 ， 不 
少 针 对 高 并 发 设计 的 语言 流行 起 来 ， 如 Erlang (代表 作 RabbitMQ )、Scala (代表 作 Apache 
Spark)， 还 有 最 近 由 Mozilla 基金 会 推出 的 Rust， 以 及 本 书 的 主角 Go 语言 。 从 目前 的 状态 
来 看 ，Go 语言 取得 的 成 就 远 高 于 其 他 三 种 语言 ， 尽 管 未 来 究竟 哪 种 语言 会 成 为 新 的 基础 架 
构 语 言 还 不 可 知 ， 但 高 并 发 肯定 会 是 一 个 必 备 的 特性 。 

Go 语言 的 作者 是 Robert Griesemer、Rob Pike 和 Ken Thompson， 与 我 年 龄 相仿 的 程序 
员 对 Ken Thompson 应 该 不 会 陌生 ， 他 在 UNIX 和 C 语言 开发 中 的 巨大 贡献 让 他 的 名 字 被 大 
量 的 程序 员 所 熟知 。 也 正 因为 如 此 ,在 Go 语言 中 ,我 们 看 到 了 大 量 C 的 痕迹 和 UNIX 的 设 
计 哲 学 。 

本 书 的 作者 之 一 Brian Kernighan 也 是 著名 的 经 典 C 语言 手册 《 C 程序 设计 语言 > 的 
作者 ， 程 序 员 们 甚至 将 《 C 程序 设计 语言 》 亲 切 地 称 为 “K&R C”。 而 本 书 的 名 字 也 暗示 
了 全 书 的 品质 将 再 现 经 典 。 我 们 也 不 应 该 忽视 ，Kernighan 和 Go 语言 作者 之 一 Rob Pike 是 
另 一 本 经 典 作品 《程序 设计 实践 》 的 作者 。 这 些 极其 珍贵 的 历史 经 验 和 始终 在 第 一 线 实践 的 
宝贵 经 验 ， 结 合作 者 多 年 的 教学 和 写作 凝 成 的 文笔 ,更 是 为 本 书 的 经 典 品质 铸就 了 坚实 的 基 
础 。 我 们 在 翻译 本 书 中 充分 体会 到 : 通过 对 一 个 又 一 个 语言 特性 深入 浅 出 的 介绍 ， 对 设计 取 
舍 和 具体 实例 的 全 面 分 析 ， 以 及 与 其 他 语言 的 综合 对 比 ， 本 书 揭示 了 Go 语言 背后 的 设计 思 
想 。 本 书 能 够 让 新 手 一 开始 就 走 在 正确 的 道路 上 ， 让 老手 能 够 更 精准 地 把 握 语言 的 设计 意 


日 本 书 中 文 版 由 机 械 工业 出 版 社 引 进 并 出 版 ，ISBN: 978-7-111-12806-0。 


图 ， 确实 是 Go 语言 的 一 本 经 典 之 作 ! 

这 本 书 是 “七 牛人 ”为 推广 Go 语言 贡献 的 第 三 本 书 ，2012 年 上 海 七 牛 信息 技术 有 限 
公司 的 创始 人 许 式 伟 和 吕 桂 华 合 著 了 国内 的 第 一 本 Go 语言 书籍 《 Go 语言 编程 》 2013 年 
又 集合 该 公司 的 力量 翻译 了 本 书 ， 还 组 织 了 以 Go 语言 为 主题 的 ECUG 年 度 大 会 。“ 七 牛 云 ” 
从 Go 语言 中 获 益 良 多 ， 我 们 也 很 乐于 为 Go 语言 以 及 Go 社区 的 发 展 贡献 一 份 我 们 自己 的 
力量 。 

祝 大 家 开卷 有 益 ! 


李 道 兵 
上 海 七 牛 信息 技术 有 限 公 司 首席 架构 师 
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“Go 是 一 种 开源 的 程序 设计 语言 ， 它 意 在 使 得 人 们 能 够 方便 地 构建 简单 、 可 靠 、 高 效 的 
软件 。" (来自 Go 官网 golang.org) 

Go 在 2007 年 9 月 形成 构想 ， 并 于 2009 年 11 月 发 布 ， 其 发 明 人 是 Robert Griesemer、 
Rob Pike 和 Ken Thompson， 这 几 位 都 任职 于 Google。 该 语言 及 其 配套 工具 集 使 得 编译 和 执 
行 既 富 有 表达 力 又 高 效 ， 而 且 使 得 程序 员 能 够 轻松 写 出 可 靠 、 健 壮 的 程序 。 

Go 和 C 从 表面 上 看 起 来 相似 ， 而 且 和 C 一 样 ， 它 也 是 专业 程序 员 使 用 的 一 种 工具 ， 兼 
有 事半功倍 之 效 。 但 是 Go 远 不 止 是 C 的 一 种 升级 版 本 。 基 于 多 种 其 他 语言 ， 它 取 其 精华 ， 
去 其 糟粕 。 它 实现 并 发 功能 的 设施 是 全 新 的 、 高 效 的 ， 实 现 数据 抽象 和 面向 对 象 的 途径 是 极 
其 灵活 的 。 它 还 实现 了 自动 化 的 内 存 管理 ， 或 称 为 垃圾 回收 。 

Go 特别 适用 于 构建 基础 设施 类 软件 (如 网 络 服务 器 )， 以 及 程序 员 使 用 的 工具 和 系统 等 。 
但 它 的 的 确 确 是 一 种 通用 语言 ， 而 且 在 诸多 领域 (如 图 像 处理 、 移 动 应 用 和 机 器 学 习 ) 中 都 
能 发 现 它 的 身影 。 它 在 很 多 场合 下 用 于 替换 无 类 型 的 脚本 语言 ， 这 是 由 于 它 兼 顾 了 表达 力 和 
安全 性 : Go 程序 通常 比 动态 语言 程序 运行 速度 要 快 ， 由 于 意料 之 外 的 类 型 错误 而 导致 月 省 
的 情形 更 是 少 得 多 。 

Go 是 个 开源 项 目 ， 所 以 其 编译 器 、 库 和 工具 的 源 代码 是 人 人 和 顷 可 免费 取得 的 。 来 自 全 
世界 的 社区 都 在 积极 地 向 这 个 项 目 贡献 代码 。Go 的 运行 环境 包括 类 UNIX 系统 一 一 Linux、 
FreeBSD、OpenBSD 和 Mac OS X， 还 有 Plan 9 和 Microsoft Windows。 只 要 在 其 中 一 个 环 
境 中 写 了 一 个 程序 ， 那 么 基本 上 不 加 修改 它 就 可 以 运行 在 其 他 环境 中 。 

本 书 旨 在 帮助 读者 立刻 开始 使 用 Go， 以 及 熟练 掌握 这 门 语言 ， 并 充分 地 利用 Go 的 语 
言 特性 和 标准 库 来 撰写 清晰 的 、 符 合 习惯 用 法 的 、 高 效 的 程序 。 


Go 的 起 源 

和 生物 学 物种 一 样 ， 成 功 的 语言 会 繁衍 后 代 ， 这 些 后 代 语 言 会 从 它们 的 祖先 那里 汲取 各 
种 优点 ; 有 时 候 , 语言 间 的 “混血 ”会 产生 异常 强大 的 力量 ; 在 一 些 罕见 情况 下 ， 某 个 重大 
的 语言 特性 也 可 能 凭空 出 现 而 并 无 先例 。 通 过 考察 语言 间 的 影响 ， 我 们 可 以 学 得 不 少 知识 ， 
比如 语言 为 什么 会 变 成 这 个 样子 ， 以 及 它 适合 用 于 哪些 环境 ， 等 等 。 

下 图 展示 了 更 早出 现 的 程序 设计 语言 对 Go 产生 的 最 重要 影响 。 

Go 有 时 会 称 为 “类 C 语言 ”或 “21 世纪 的 C”。 从 C 中 ，Go 继承 了 表达 式 语法 、 控 
制 流 语句 、 基 本 数据 类 型 、 按 值 调用 的 形 参 传递 和 指针 ,但 比 这 些 更 重要 的 是 , 继承 了 C 
所 强调 的 要 点 : 程序 要 编译 成 高 效 的 机 器 码 ， 并 自然 地 与 所 处 的 操作 系统 提供 的 抽象 机 制 相 
配合 。 

可 是 ，Go 的 家 谱 中 还 有 其 他 祖先 。 产 生 主 要 影响 的 是 由 Niklaus Wirth 设计 的 、 以 
Pascal 为 发 端的 一 个 语言 支流 。Modula-2 启发 了 包 概 念 。Oberon 消除 了 模块 接口 文件 和 
模块 实现 文件 之 间 的 差异 。Oberon-2 影响 了 包 、 导 入 和 声明 的 语法 ， 并 提供 了 方法 声明 的 


语法 。 


VII 


ALGOL 60 
(Backus et al., 1960) 
Pascal 
(Wirth, 1970) 
G€ 
(Ritchie, 1972) 
CSP 
(Hoare, 1978) Modula-2 
(Wirth, 1980) 
Squeak 
(Cardelli & Pike, 1985) Oberon 
(Wirth & Gutknecht, 
1986) 
MSsqueak Object Oberon 
y (M6ssenbéck, Templ 
& Griesemer, 1990) 
Alef Oberon-2 PA 
i (Wirth & M6ssenb6ck, 
(Winterbottom, 1992) 1991) 





Go 
(Griesemer, Pike & Thompson, 2009) 


Go 的 另 一 文 世系 祖先 一 一 它 使 得 Go 相对 于 当下 的 程序 设计 语言 显得 卓然 不 群 ， 是 
在 贝尔 实验 室 开发 的 一 系列 名 不 见 经 传 的 研究 用 语言 。 这 些 语言 都 受到 了 通信 顺序 进程 
(Communicating Sequential Process，CSP) 的 启发 ，CSP 由 Tony Hoare 于 1978 年 在 发 表 的 
关于 并 发 性 基础 的 开创 性 论文 中 提出 。 在 CSP 中 ， 程 序 就 是 一 组 无 共享 状态 进程 的 并 行 组 
合 ， 进 程 间 的 通信 和 同步 采用 通道 完成 。 不 过 ，Hoare 提出 的 CSP 是 一 种 形式 语言 ， 仅 用 于 
描述 并 发 性 的 基本 概念 ， 并 不 是 一 种 用 来 撰写 可 执行 程序 的 程序 设计 语言 。 

Rob Pike 等 人 开始 动手 做 一 些 实验 ， 尝 试 把 CSP 实现 为 真正 的 语言 。 第 一 种 这 样 的 语 
言 称 为 Squeak (“ 和 鼠 类 沟通 的 语言 ") 9 ， 它 是 一 种 用 于 处 理 鼠 标 和 键盘 事件 的 语言 ， 其 中 
具有 静态 创建 的 通道 。 紧 接着 它 的 是 Newsqueak， 它 具有 类 C 的 语句 和 表达 式 语 法 ， 以 及 
类 Pascal 的 类 型 记 法 。 它 是 一 种 纯粹 的 函数 式 语言 ， 具 有 垃圾 回收 功能 ， 同 样 也 以 管理 键 
盘 、 鼠 标 和 窗口 事件 为 目标 。 通 道 变 成 了 “一 等 ” 值 ( first-class value)， 它 可 以 动态 创建 并 
用 变量 存储 。 

Plan 9 操作 系统 将 这 些 思想 都 纳入 一 种 称 为 Alef 的 语言 中 。Alef 尝试 将 Newsqueak 改 
造成 一 种 可 用 的 系统 级 程序 设计 语言 ， 但 垃圾 回收 功能 的 缺失 使 得 它 在 处 理 并 发 性 时 捉 襟 
见 肘 。 

Go 中 的 其 他 结构 也 会 不 时 显示 出 某 些 并 非 来 自 祖先 的 基因 。 例 如 ，iota 多 多 少 少 有 点 
APL 的 影子 ， 而 能 套 函 数 的 词法 作用 域 则 来 自 Scheme (以 及 由 之 而 来 的 大 部 分 语言 )。 在 
Go 语言 中 ， 也 可 以 发 现 全 新 的 变异 。Go 中 新 颖 的 slice 不 仅 为 动态 数组 提供 了 高 效 的 随机 
访问 功能 ， 还 允许 旧式 链表 的 复杂 共享 机 制 。 另 外 ，defer 语句 也 是 Go 中 新 引入 的 。 


Go 项 目 
所 有 的 程序 设计 语言 都 反映 了 其 发 明 者 的 程序 设计 哲理 ， 其 中 相当 大 的 一 部 分 是 对 于 此 


日 该 单词 直译 为 (老鼠 的 ) 咏 野 叫 声 ， 是 为 隐喻 和 双关 。 一 一 译 者 注 
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前 语言 已 知 缺点 的 应 对 措施 。Go 这 个 项 目 也 诞生 于 挫败 感 ， 这 种 挫败 感 来 源 于 Google 的 若 
干 复杂 性 激增 的 软件 系统 。( 而 且 这 个 问题 绝 非 Google 所 独 有 的 。) 





的 某 个 部 分 变 得 更 加 复杂 ， 这 不 可 避免 地 也 给 其 他 部 分 增加 了 复杂 性 。 在 不 断 要 求 增加 系统 
功能 、 选 项 和 配置 ， 以 及 快速 发 布 的 压力 之 下 ， 简 单 性 往往 被 忽视 了 (尽管 长 期 来 看 ， 简 单 
性 才 是 好 软件 的 不 二 法 门 )。 

要 实现 简单 性 ， 就 要 求 在 项 目的 一 开始 就 浓缩 思想 的 本 质 ， 并 在 项 目的 整个 生命 周期 制 
定 更 具体 的 准则 ， 以 分 辨 出 哪些 变化 是 好 的 ， 哪 些 是 坏 的 或 致命 的 。 只 要 足够 努力 ， 好 的 变 
化 就 既 可 以 实现 目的 ， 又 能 够 不 损害 Fred Brooks 所 谓 软 件 设计 上 的 “概念 完整 性 ”。 坏 的 
变化 就 做 不 到 这 一 点 ， 而 致命 的 变化 则 会 牺牲 “简单 性 ”去 换 得 浅薄 的 “方便 性 ”。? 但 是 ， 
只 有 通过 设计 上 的 简单 性 ， 系 统 才 能 在 增长 过 程 中 保持 稳定 、 安 全 和 自 洽 。 

Go 项 目 不 仅 包括 该 语言 本 身 及 其 工具 和 标准 库 ， 还 有 决 不 能 忽视 的 一 点 ， 就 是 它 保持 
极端 简单 性 的 行为 文化 。 在 高 级 语言 中 ，Go 出 现 得 较 晚 ， 因 而 有 一 定 后 发 优势 ， 它 的 基础 
部 分 实现 得 不 错 : 有 垃圾 回收 、 包 系统 、 一 等 公民 函数 、 词 法 作用 域 、 系 统 调用 接口 ， 还 有 
默认 用 UTF-8 编码 的 不 可 变 字 符 串 。 但 相对 来 说 ， 它 的 语言 特性 不 多 ， 而 且 不 太 会 增加 新 
特性 了 。 比 如 ， 它 没有 隐 式 数值 类 型 强制 转换 ， 没有 构造 或 析 构 函数 ， 没 有 运算 符 重 载 ， 没 
有 形 参 默认 值 ， 没 有 继承 ， 没 有 泛 型 ， 没 有 异常 ， 没 有 宏 ， 没 有 函数 注解 ， 没 有 线程 局 部 存 
储 。 这 门 语言 成 熟 而 且 稳 定 ， 并 且 保 证 兼容 更 早 版 本 : 在 旧版 本 的 Go 语言 中 写 的 程序 ， 可 
以 在 新 版 本 的 编译 器 和 标准 库 下 编译 与 运行 。 

Go 的 类 型 系统 足 可 以 使 程序 员 避 免 在 动态 语言 中 会 无 意 犯 下 的 绝 大 多 数 错误 ， 但 相对 
而 言 ， 它 在 带 类 型 的 语言 中 又 算是 类 型 系统 比较 简单 的 。 其 实现 方法 有 时 候 会 导致 类 型 框 
架 林 立 却 彼此 孤立 的 “无 类 型 ”程序 设计 风格 ， 并 且 Go 程序 员 在 类 型 方面 不 会 像 C++ 或 
Haskell 程序 员 那 样 走 极 端 一 一 反复 表达 类 型 安全 性 以 证 明 语 言 是 基于 类 型 的 。 但 在 实际 工 
作 中 ，Go 却 能 为 程序 员 提 供 只 有 强 类 型 的 系统 才能 实现 的 安全 性 和 运行 时 性 能 ， 而 不 让 程 
序 员 承担 其 复杂 性 。 

Go 提倡 充分 利用 当代 计算 机 系统 设计 ， 尤 其 强调 局 部 性 的 重要 意义 。 其 内 置 数据 类 型 
和 大 多 数 库 数 据 结构 都 经 过 仔细 设计 ， 力 求 以 自然 方式 工作 ， 而 不 要 求 显 式 的 初始 化 或 隐 式 
的 构造 函数 。 这 么 一 来 ， 隐 藏 在 代码 中 的 内 存 分 配 和 内 存 写 人 就 大 大 减少 了 。Go 中 的 聚合 
类 型 (结构 体 和 数组 ) 都 以 直接 方式 持 有 其 元 素 ， 与 使 用 间接 字段 的 语言 相 比 ， 它 需要 更 少 
的 存储 空间 以 及 更 少 的 分 配 操作 和 指针 间接 寻 址 操作 。 正 如 前 面 提 到 的 那样 ， 由 于 现代 计算 
机 都 是 并 行 工作 的 ， 因 此 Go 具有 基于 CSP 的 并 行 特性 。Go 还 提供 了 变 长 栈 来 运行 其 轻 量 
级 线程 ， 或 称 为 goroutine。 这 个 栈 初 始 时 非常 小 ， 所 以 创建 一 个 goroutine 的 成 本 极 低 ， 创 
建 100 万 个 也 完全 可 以 接受 。 

Go 标准 库 常 常 称 作 “ 自 带电 池 的 语言 "， 它 提供 了 清晰 的 构件 ， 以 及 用 于 IO 、 文 本 处 
理 、 图 形 、 加 密 、 网 络 、 分 布 式 应 用 的 API， 而 且 对 许多 标准 文件 格式 和 协议 都 提供 了 支 
持 。Go 的 库 和 工具 充分 地 尊重 惯例 ， 避 免 了 配置 和 解释 ， 从 而 简化 了 程序 逻辑 ， 提 高 了 多 
种 多 样 的 Go 程序 之 间 的 相似 性 ， 使 得 它 更 容易 学 习 和 掌握 。 采 用 go 工具 构建 的 项 目 ， 仅 使 
用 文件 和 标识 符 的 名 字 (在 极 少 情况 下 使 用 特殊 注释 )， 就 可 以 推断 出 一 个 项 目 使 用 的 所 有 


日 见 《 人 月 神话 》。 一 一 译 者 注 


库 、 可 执行 文件 、 测 试 、 性 能 基准 、 示 例 、 平 台 相 关 变 体 ， 以 及 文档 。Go 的 源 代 码 中 就 包 
含 了 构建 的 规格 说 明 。 


本 书 结构 

我 们 假定 你 已 用 一 两 种 其 他 语言 编 过 程序 ， 可 能 是 像 C、C++ 或 Java 那样 的 编译 型 语 
言 ， 也 可 能 是 像 Python、Ruby 或 JavaScript 那样 的 解释 型 语言 ， 所 以 本 书 不 会 像 针对 一 个 
零 基础 的 初学 者 那样 事 无 巨细 地 讲述 所 有 内 容 。 表 面 上 的 语法 大 体 雷 同 ， 变 量 、 常 量 、 表 达 
式 、 控 制 流 和 函数 也 一 样 。 

第 1 章 是 关于 Go 的 基础 结构 的 综述 ， 通 过 十 几 个 完成 日 常任 务 (包括 读 写 文件 、 格 式 
化 文本 、 创 建 图 像 ， 以 及 在 Internet 客户 端 和 服务 器 之 间 通 信 ) 的 程序 来 介绍 这 门 语言 。 

第 2 章 讲 述 Go 程序 的 组 成 元 素 一 一 声明 、 变 量 、 新 类 型 、 包 和 文件 ， 以 及 作用 域 。 
第 3 章 讨论 数值 、 布 尔 量 、 字 符 串 、 常 量 ， 还 解释 如 何 处 理 Unicode。 第 4 章 描述 复合 类 
型 ， 即 使 用 简单 类 型 构造 的 类 型 ， 形 式 有 数组 、map 、 结 构 体 ， 还 有 slice ( Go 中 动态 列表 
的 实现 )。 第 5 章 概 述 函 数 ， 并 讨论 错误 处 理 、 宕 机 ( panic) 和 恢复 ( recover)， 以 及 defer 
语句 。 

可 以 看 出 ,第 1 ~ 5 章 是 基础 性 的 ， 其 内 容 是 任何 主流 命令 式 语言 都 有 的 。Go 的 语法 
和 风格 可 能 与 其 他 语言 有 所 不 同 ， 但 大 多 数 程序 员 都 能 很 快 掌握 这 些 内 容 。 余 下 的 章节 重点 
讨论 Go 语言 中 与 惯常 做 法 有 一 定 区 别 的 内 容 ， 包 括 方法 、 接 口 、 并 发 、 包 、 测 试 和 反射 。 

Go 以 一 种 不 同 寻 常 的 方式 来 诠释 面向 对 象 程序 设计 。 它 没有 类 继承 ， 其 至 没有 类 。 较 
复杂 的 对 象 行为 是 通过 较 简单 的 对 象 组 合 (而 非 继 承 ) 完成 的 。 方 法 可 以 关联 到 任何 用 户 定 
义 的 类 型 ， 而 不 一 定 是 结构 体 。 具 体 类 型 和 抽象 类 型 ( 即 接口 ) 之 间 的 关系 是 隐 式 的 ， 所 以 
一 个 具体 类 型 可 能 会 实现 该 类 型 设计 者 没有 意识 到 其 存在 的 接口 。 第 6 章 讲 述 方法 , 第 7 章 
讲述 接口 。 

第 8 章 介绍 Go 的 并 发 性 处 理 途 径 ， 它 基于 CSP 思想 ， 采 用 goroutine 和 通道 实现 。 第 
9 章 则 讨论 并 发 性 中 基于 共享 变量 的 一 些 传统 话题 。 

第 10 章 讨 论 包 ， 也 就 是 组 织 库 的 机 制 。 该 章 也 说 明 如 何 高 效 地 利用 go 工具 ， 仅 仅 这 个 
工具 ， 就 提供 了 编译 、 测 试 、 性 能 基准 测试 、 程 序 格式 化 、 文 档 ， 以 及 完成 许多 其 他 任务 的 
功能 。 

第 11 章 讨论 测试 ， 在 这 里 Go 采取 了 显著 的 轻 量 级 途径 ， 避 免 了 重重 抽象 的 框架 ， 转 
而 使 用 简单 的 库 和 工具 。 测 试 库 提 供 了 一 个 基础 ， 在 其 之 上 根据 需要 可 以 构建 更 复杂 的 抽象 。 

第 12 章 讨论 反射 ， 即 程序 在 执行 期 间 考察 自身 表示 方式 的 能 力 。 反 射 是 一 种 强大 的 工 
具 ， 不 过 要 慎重 使 用 它 ， 该 章 通过 演示 如 何 用 它 来 实现 某 些 重要 的 Go 库 , 解释 了 如 何 统 筹 
兼顾 。 第 13 章 解 释 低级 程序 设计 的 细节 ( 它 运 用 unsafe 包 来 绕 过 Go 的 类 型 系统 )， 以 及 什 
么 时 候 适 合 这 样 做 。 

每 章 都 配 以 一 定数 量 的 练习 ， 可 以 用 来 测试 你 对 Go 的 理解 ， 或 者 探索 对 书 中 示例 的 扩 
展 和 变形 。 

除了 最 简单 的 示例 代码 以 外 ， 书 中 所 有 的 示例 代码 都 可 以 从 gopl.io 网 站 的 公开 Git 仓 
库 下 载 。 每 个 示例 以 其 包 的 导入 路 径 开 头 和 命名 ， 从 而 能 够 方便 地 使 用 go get 命令 获取 、 构 
建 和 安装 。 你 需要 选取 一 个 目录 作为 你 的 Go 工作 空间 ， 并 使 GoPATH 环境 变量 指向 它 。 在 必 
要 时 ，go 工具 会 创建 该 目录 。 例 如 : 


$ export GOPATH=$HOME/gobook # choose workspace directory 
$ go get gopl.io/ch1i/helloworld # fetch, build, install 

$ $GOPATH/bin/helloworld # run 

Hello， 世 界 


要 运行 这 些 例子 ， 至 少 需要 使 用 1.5 版 本 的 Go 语言 。 


$ go version 
go version go1.5 linux/amd64 


如 果 你 的 计算 机 上 的 go 工具 版 本 太 旧 或 者 缺失 ， 请 按 https://golang.org/doc/install 
上 的 步骤 操作 。 


更 多 信息 来 源 

关于 Go 的 更 多 信息 ， 最 好 的 来 源 就 是 Go 的 官方 网 站 : https://golang.org。 其 中 列 出 
了 文档 供 读者 访问 ， 包 括 Go 程序 设计 语言 规范 、 标 准 包 等 。 其 中 还 列 出 Go 语言 教程 ， 指 
导 如 何 撰写 Go 程序 ， 以 及 如 何 撰写 好 的 Go 程序 ， 还 有 大 量 在 线 文本 和 视频 资源 ， 这 些 都 
是 本 书 的 主要 补充 资源 。 位 于 blog.golang.org 的 Go 博客 发 布 的 是 关于 Go 的 最 好 文章 ， 内 
容 涉 及 该 语言 当下 的 状态 、 未 来 的 计划 、 会 议 方面 的 报告 ， 还 有 Go 相关 的 大 量 话题 的 深度 
解读 。 

Go 官网 在 线 访问 最 有 用 的 一 个 方面 (这 也 是 纸 质 书 的 一 个 令 人 遗憾 的 限制 )， 就 是 提供 
了 从 描述 Go 程序 的 网 页 上 直接 运行 的 能 力 。 这 种 功能 由 位 于 play.golang.org 的 Go 训练 场 
(Playground) 提供 ， 也 可 以 艇 入 其 他 页 面 ， 比 如 golang.org 的 首页 ， 或 者 由 godoc 工具 提供 
的 文档 页 面 。 

训练 场 为 读者 对 简短 的 程序 执行 简单 的 实验 提供 了 方便 ， 有 助 于 读者 检验 自己 对 语法 、 
语义 和 库 包 的 理解 ， 并 且 它 在 很 多 方面 取代 了 其 他 语言 中 的 读 取 - 求 值 -输出 循环 (Read- 
Eval-Print Loop,REPL)。 它 的 永久 URL 对 于 共享 Go 代码 段 、 报 告 bug 或 提出 建议 都 很 有 用 。 

在 训练 场 的 基础 之 上 ， 位 于 tour.golang.org 的 Go Tour 就 是 一 系列 简短 的 交互 式 课 程 
(内 容 是 Go 语言 的 基础 思想 和 结构 )， 也 是 学 习 整 门 语言 的 系统 资源 。 

训练 场 和 Go Tour 的 主要 缺点 在 于 它 只 允许 导入 标准 库 ， 并 且 很 多 库 特 性 (比如 网 络 库 ) 
都 出 于 可 操作 性 或 安全 原因 限制 使 用 。 而 要 编译 和 运行 每 个 程序 ， 都 要 求 Internet 连接 。 所 
以 ， 欲 进行 更 详尽 的 实验 ,需要 在 本 机 上 运行 Go 程序 。 幸 运 的 是 ， 下 载 过 程 相 当 简单 ， 从 
golang.org 获取 Go 的 安装 版 本 并 开始 撰写 和 运行 你 自己 的 Go 程序 ， 用 不 了 几 分钟 。 

由 于 Go 是 个 开源 项 目 ， 因 此 你 可 以 从 https://golang.org/pkg 上 在 线 读 取 标准 库 中 的 任 
何 类 型 或 函数 的 代码 ， 每 个 供 下 载 的 版 本 都 同样 包含 这 些 代 码 。 请 使 用 这 些 代码 来 弄 明白 某 
些 程序 的 运行 原理 、 回 答 关 于 程序 细节 的 问题 ， 也 可 以 用 它们 来 学 一 学 专家 是 如 何 写 出 一 流 
的 Go 代码 的 。 
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The Go Programming Language 


入 门 





本 章 是 对 于 Go 语言 基本 组 件 的 一 些 说 明 。 和 希望 本 章 所 提供 的 足够 信息 和 示例 ， 能 够 使 
您 尽 可 能 快 地 做 一 些 有 用 的 东西 。 本 书 所 有 的 例子 都 是 针对 现实 世界 的 任务 的 。 本 章 将 带 您 
尝试 体验 用 Go 语言 来 编写 各 种 程序 : 从 简单 的 文件 、 图 片 处 理 到 并 发 的 客户 端 和 服务 器 的 
互联 网 应 用 开发 。 虽 然 在 一 章 里 不 能 把 所 有 东西 讲 清楚 ， 但 是 以 这 类 应 用 作为 学 习 一 门 语 言 
的 开始 是 一 种 高 效 的 方式 。 

学 习 新 语言 比较 自然 的 方式 ， 是 使 用 新 语言 写 一 些 你 已 经 可 以 用 其 他 语言 实现 的 程序 。 我 
们 试图 说 明和 解释 如 何 用 好 Go 语言 ， 当 你 写 自 己 的 代码 的 时 候 ， 本 章 的 代码 可 以 作为 参考 。 


1.1 hello, world 


我 们 依然 从 永恒 的 “hello，world” 例 子 开始 ， 它 出 现在 1978 年 出 版 的 《 The C Program- 
ming Language 》 这 本 书 的 开头 。C 对 Go 的 影响 非常 直接 ， 我 们 用 “hello，world” 来 说 明 
一 些 主要 的 思路 : 

gopl.io/ch1/helloworld 
package main 





import "fmt" 


func main() 
fmt.Println("Hello, 世界 ") 
} 


Go 是 编译 型 的 语言 。Go 的 工具 链 将 程序 的 源 文件 转变 成 机 器 相关 的 原生 二 进 制 指 令 。 
这 些 工具 可 以 通过 单一 的 go 命令 配合 其 子 命令 进行 使 用 。 最 简单 的 子 命令 是 run， 它 将 一 个 
或 多 个 以 .go 为 后 缀 的 源 文件 进行 编译 、 链 接 ， 然 后 运行 生成 的 可 执行 文件 (本 书 中 我 们 使 
用 $ 符 号 作为 命令 提示 符 ): 


$ go run helloworld.go 


不 出 意料 地 ， 这 将 输出 : 

Hello， 世 界 

Go 原生 地 支持 Unicode， 所 以 它 可 以 处 理 所 有 国家 的 语言 。 

如 果 这 个 程序 不 是 一 次 性 的 实验 ， 那 么 编译 输出 成 一 个 可 复 用 的 程序 比较 好 。 这 通过 go 
build 来 实现 : 


$ go build helloworld.go 


这 条 命令 生成 了 一 个 叫 作 helloworld 的 二 进 制程 序 ， 它 可 以 不 用 进行 任何 其 他 处 理 ， 随 
时 执行 : 


$ ./helloworld 
Hello，, 世界 


L 
汕 


1 汪 





我 们 给 每 一 个 重要 的 例子 都 加 了 一 个 标签 ， 提 示 你 可 以 从 本 书 在 gopl.io 的 源码 库 获 取 
代码 : 


gopl.io/ch1/helloworld 


如 果 执 行 go get gopl.io/chl/helloworld， 它 将 会 把 源 代码 取 到 相应 的 目录 。 这 将 在 2.6 
节 和 10.7 节 进 行 更 多 的 讨论 。 

现在 我 们 来 说 说 该 程序 本 身 。Go 代码 是 使 用 包 来 组 织 的 ， 包 类 似 于 其 他 语言 中 的 库 和 
模块 。 一 个 包 由 一 个 或 多 个 .go 源 文件 组 成 ， 放 在 一 个 文件 夹 中 ， 该 文件 夹 的 名 字 描 述 了 包 
的 作用 。 每 一 个 源 文件 的 开始 都 用 package 声明 ， 例 子 里 面 是 package main， 指 明了 这 个 文 
件 属于 哪个 包 。 后 面 跟 着 它 导入 的 其 他 包 的 列表 ， 然 后 是 存储 在 文件 中 的 程序 声明 。 

Go 的 标准 库 中 有 100 多 个 包 用 来 完成 输入 、 输 出 、 排 序 、 文 本 处 理 等 常规 任务 。 例 如 ， 
fmt 包 中 的 函数 用 来 格式 化 输出 和 扫描 输入 。pPrintln 是 fmt 中 一 个 基本 的 输出 函数 ， 它 输出 
一 个 或 多 个 用 空格 分 隔 的 值 ， 结 尾 使 用 一 个 换行 符 ， 这 样 看 起 来 这 些 值 是 单行 输出 。 

名 为 main 的 包 比 较 特 殊 ， 它 用 来 定义 一 个 独立 的 可 执行 程序 ， 而 不 是 库 。 在 main 包 中 ， 
函数 main 也 是 特殊 的 ， 不 管 在 什么 程序 中 ，main 做 什么 事情 ， 它 总 是 程序 开始 执行 的 地 方 。 
当然 ，main 通常 调用 其 他 包 中 的 函数 来 做 更 多 的 事情 ， 比 如 fmt.pPrintln。 

我 们 需要 告诉 编译 器 源 文件 需要 哪些 包 ， 用 package 声明 后 面 的 inport 来 导入 这 些 包 。 
“hello，world ”程序 仅 使 用 了 一 个 来 自 于 其 他 包 的 函数 ， 而 大 多 数 程 序 可 能 导 人 更 多 的 包 。 

你 必须 精确 地 导入 需要 的 包 。 在 缺失 导入 或 存在 不 需要 的 包 的 情况 下 ， 编 译 会 失败 ， 这 
种 严格 的 要 求 可 以 防止 程序 演化 中 引用 不 需要 的 包 。 

import 声明 必须 跟 在 package 声明 之 后 。import 导入 声明 后 面 ， 是 组 成 程序 的 函数 、 变 
量 、 常 量 、 类 型 (以 func、var、const、type 开头 ) 声明 。 大 部 分 情况 下 ， 声 明 的 顺序 是 没 
有 关系 的 。 示 例 中 的 程序 足够 短 ， 因 为 它 只 声明 了 一 个 函数 ， 这 个 函数 又 仅仅 调用 了 一 个 其 
他 的 函数 。 为 了 节省 空间 ， 在 处 理 示 例 的 时 候 ， 我 们 有 时 不 展示 package 和 import 声明 ， 但 
是 它们 存在 于 源 文件 中 ， 并 且 编 译 时 必 不 可 少 。 

一 个 函数 的 声明 由 func 关键 字 、 子 数 名 、 参 数列 表 (main 函数 为 空 )、 返 回 值 列表 (可 
以 为 空 )、 放 在 大 括号 内 的 函数 体 组 成 ， 函 数 体 定义 函数 是 用 来 做 什么 的 ， 这 将 在 第 5 章 详 
细 介 绍 。 

Go 不 需要 在 语句 或 声明 后 面 使 用 分 号 结尾 ， 除 非 有 多 个 语句 或 声明 出 现在 同一 行 。 事 
实 上 ， 跟 在 特定 符号 后 面 的 换行 符 被 转换 为 分 号 ， 在 什么 地 方 进行 换行 会 影响 对 Go 代码 的 
解析 。 例 如 ,“{” 符 号 必须 和 关键 字 func 在 同一 行 ， 不 能 独自 成 行 ， 并 且 在 x+y 这 个 表达 
式 中 ， 换 行 符 可 以 在 + 操作 符 的 后 面 ， 但 是 不 能 在 + 操作 符 的 前 面 。 

Go 对 于 代码 的 格式 化 要 求 非 常 严 格 。gofmt 工具 将 代码 以 标准 格式 重 写 ，go 工具 的 fmt 
子 命令 使 用 gofmt 工具 来 格式 化 指定 包 里 的 所 有 文件 或 者 当前 文件 夹 中 的 文件 (默认 情况 
下 )。 本 书 中 包含 的 所 有 Go 源 代 码 文 件 都 使 用 gofmt 运行 过 ， 你 应 该 养 成 对 自己 的 代码 使 用 
gofmt 工具 的 习惯 。 定 制 一 个 标准 的 格式 ， 可 以 省 去 大 量 无 关 紧 要 的 辩论 ， 更 重要 的 是 ， 如 
果 人 允许 随心 所 欲 的 格式 ， 各 种 自动 化 的 源 代码 转换 工具 将 不 可 用 。 

许多 文本 编辑 器 可 以 配置 为 每 次 在 保存 文件 时 自动 运行 gofmt， 因 此 源 文件 总 可 以 保持 
正确 的 形式 。 此 外 ， 一 个 相关 的 工具 goimports 可 以 按 需 管理 导入 声明 的 插入 和 移 除 。 它 不 
是 标准 发 布 版 的 一 部 分 ， 可 以 通过 执行 下 面 的 命令 获取 到 : 





$ go get golang.org/x/tools/cmd/goimports 


对 大 多 数 用 户 来 说 ， 按 照常 规 方式 下 载 、 编 译 包 ， 执 行 自 带 的 测试 ， 查 看 文档 等 操作 ， 
使 用 go 工具 都 可 以 实现 ， 这 将 在 10.7 节 详 细 介 绍 。 


1.2 命令 行 参数 


大 部 分 程序 处 理 输入 然后 产生 输出 ， 这 就 是 关于 计算 的 大 致 定义 。 但 是 程序 怎样 获取 数 
据 的 输入 呢 ? 一 些 程序 自己 生成 数据 ， 更 多 的 时 候 ， 输 入 来 自 一 个 外 部 源 : 文件 、 网 络 连 
接 、 其 他 程序 的 输出 、 键 盘 、 命 令 行 参 数 等 。 随 后 的 一 些 示例 将 从 命令 行 参数 开始 讨论 这 些 
输入 。 

os 包 提供 一 些 函 数 和 变量 ， 以 与 平台 无 关 的 方式 和 操作 系统 打交道 。 命 令 行 参数 以 os 
包 中 Args 名 字 的 变量 供 程序 访问 ， 在 os 包 外 面 ， 使 用 os.Args 这 个 名 字 。 

变量 os.Args 是 一 个 字符 串 slice。slice 是 Go 中 的 基础 概念 ， 很 快 我 们 将 讨论 到 它 。 现 
在 只 需 理 解 它 是 一 个 动态 容量 的 顺序 数组 s， 可 以 通过 s[i] 来 访问 单个 元 素 ， 通过 s[m:n] 
来 访问 一 段 连续 子 区 间 ， 数 组 长 度 用 len(s) 表示 。 与 大 部 分 编程 语言 一 样 ， 在 Go 中 ， 所 有 
的 索引 使 用 半 开 区 间 ， 即 包含 第 一 个 索引 ， 不 包含 最 后 一 个 索引 ， 因 为 这 样 逻 辑 比 较 简 单 。 
例如 ，slice s[m:n]， 其 中 , 0 三 m 三 n < 1len(s), 包含 n-m 个 元 素 。 

os.Args 的 第 一 个 元 素 是 os.Args[86] ， 它 是 命令 本 身 的 名 字 ; 另外 的 元 素 是 程序 开始 执 
行 时 的 参数 。 表 达 式 s[m:n] 表示 一 个 从 第 "个 到 第 n-1 个 元 素 的 slice， 所 以 下 一 个 示例 中 
slice 需要 的 元 素 是 os.Args[1:len(os.Args)]。 如 果 m 或 mn 缺失 ， 默 认 分 别 是 0 或 len(s)， 所 
以 我 们 可 以 将 期 望 的 slice 简写 为 os.Args[1:]。 

这 里 有 一 个 UNIX echo 命令 的 实现 ， 它 将 命令 行 参数 输出 到 一 行 。 该 实现 导入 两 个 包 ， 
使 用 由 圆 括号 括 起 来 的 列表 ， 而 不 是 独立 的 import 声明 。 两 者 都 是 合法 的 ， 但 为 了 方便 起 
见 ， 我 们 使 用 列表 的 方式 。 导 和 人 的 顺序 是 没有 关系 的 ，gofmt 工具 会 将 其 按照 字母 顺序 表 进 
行 排序 〈 当 一 个 示例 有 几 个 版 本 时 ， 通 常 给 它们 编号 以 区 分 出 当前 讨论 的 版 本 )。 


gopl.io/ch1/echol 
// echol 输出 其 命令 行 参数 


package main 


import ( 
"fmt" 
"os" 


) 


func main() { 
var s, sep string 
for i := 1; i < len(os.Args); i++ { 
S += sep: + Os.Args[i] 
sep = 


} 
fmt.Println(s) 
} 


注释 以 // 开头 。 所 有 以 // 开头 的 文本 是 给 程序 员 看 的 注释 ， 编 译 器 将 会 忽略 它们 。 习 
惯 上 ， 在 一 个 包 声 明 前 ， 使 用 注释 对 其 进行 描述 ， 对 于 main 包 ， 注 释 是 一 个 或 多 个 完整 的 
句子 ， 用 来 对 这 个 程序 进行 整体 概括 。 


4 颁 1 芋 


var 关键 字 声 明了 两 个 string 类 型 的 变量 s 和 sep。 变 量 可 以 在 声明 的 时 候 初始 化 。 如 
果 变 量 没 有 明确 地 初始 化 ， 它 将 隐 式 地 初始 化 为 这 个 类 型 的 空 值 。 例 如 ， 对 于 数字 初始 化 结 
果 是 86， 对 于 字符 串 是 空 字 符 串 "。 在 这 个 示例 中 ，s 和 sep 隐 式 初始 化 为 空 字符 串 。 第 2 
. 章 将 讨论 变量 和 声明 。 

对 于 数字 ，Go 提供 常规 的 算术 和 逻辑 操作 符 。 当 应 用 于 字符 串 时 ，+ 操作 符 对 字符 串 的 
值 进行 追加 操作 ， 所 以 表达 式 

sep + os.Args[i] 


表示 将 sep 和 os.Args[i] 追加 到 一 起 。 程 序 中 使 用 的 语句 


Ss += Sep + os.Args[i] 


是 一 个 赋值 语句 ， 将 sep 和 os.Args[i] 追加 到 旧 的 ss 上面， 并且 重 新 赋 给 s， 它 等 价 于 下 面 
的 语句 : 


Ss=s+ sep + 0s.Args[il] 


操作 符 += 是 一 个 赋值 操作 符 。 每 一 个 算术 和 逻辑 操作 符 (例如 + 或 者 *) 都 有 一 个 对 应 
的 赋值 操作 符 。 

echo 程序 会 循环 每 次 输出 ， 但 是 这 个 版 本 中 我 们 通过 反复 追加 来 构建 一 个 字符 串 。 字 符 
串 s 一 开始 为 空 字符 串 "， 每 一 次 循环 追加 一 些 文本 。 在 第 一 次 迭代 后 ， 一 个 空格 被 插入 ， 
这 样 当 循环 结束 时 ， 每 个 参数 之 间 都 有 一 个 空格 。 这 是 一 个 二 次 过 程 ， 如 果 参 数 数 量 很 大 成 
本 会 比较 高 ， 不 过 对 于 echo 程序 还 好 。 本 章 和 下 一 章 会 展示 几 个 改进 版 本 ， 它 们 会 逐步 处 
理 掉 低 效 的 地 方 。 

循环 的 索引 变量 i 在 for 循环 开始 处 声明 。:= 符号 用 于 短 变 量 声明 ， 这 种 语句 声明 一 个 
或 多 个 变量 ， 并 且 根 据 初 始 化 的 值 给 予 合适 的 类 型 ， 下 一 章 会 详细 讨论 它 。 

递增 语句 i++ 对 i 进行 加 1， 它 等 价 于 i += 1， 又 等 价 于 i = i + 1。 对 应 的 递减 语句 i-- 
对 i 进行 减 1。 这 些 是 语句 ， 而 不 像 其 他 C 族 语言 一 样 是 表达 式 ， 所 以 j = i++ 是 不 合法 的 ， 
并 且 仅 支 持 后 缀 ， 所 以 --i 不 合法 。 

for 是 Go 里 面 的 唯一 循环 语句 。 它 有 几 种 形式 ， 这 里 展示 其 中 一 种 : 

for initialization; condition; post { 

和 // 零 个 或 多 个 语句 

for 循环 的 三 个 组 成 部 分 两 边 不 用 小 括号 。 大 括号 是 必需 的 ， 但 左 大 括号 必须 和 post( 后 
置 ) 语句 在 同一 行 。 

可 选 的 initiaLization (初始 化 ) 语句 在 循环 开始 之 前 执行 。 如 果 存 在 ， 它 必须 是 一 个 简 
单 的 语句 ， 比 如 一 个 简短 的 变量 声明 ， 一 个 递增 或 赋值 语句 ， 或 者 一 个 函数 调用 。condition 
(条 件 ) 是 一 个 布尔 表达 式 ， 在 循环 的 每 一 次 迭代 开始 前 推演 ， 如 果 推 演 结 果 是 真 ， 循 环 则 
继续 执行 。post 语句 在 循环 体 之 后 被 执行 ， 然 后 条 件 被 再 次 推演 。 条 件 变 成 假 之 后 循环 结束 。 

三 部 分 都 是 可 以 省 略 的 。 如 果 没 有 initiaLization 和 post 语句 ， 分 号 可 以 省 略 : 


// 传统 的 "while" 循环 
for condition { 

Wl ws 
} 


如 果 条 件 部 分 都 不 存在 ， 例 子 如 下 : 


// 传统 的 无 限 循环 
for { 

ye 
} 


循环 是 无 限 的 ， 尽 管 这 种 形式 的 循环 可 以 通过 如 break 或 return 等 语句 进行 终止 。 
另 一 种 形式 的 for 循环 在 字符 串 或 slice 数据 上 迭代。 为 了 说 明 ， 这 里 给 出 第 2 版 的 
echo ， 


gopl1.io/ch1/echo2 


// echo2 输出 其 命令 行 参数 
package main 


import ( 
"Fmt" 
"os" 


) 


func main() { 
s, sep := "", "" 
for _, arg := range os.Args[1:] { 
Ss += Sep + arg 
sep ="" 


fmt.Println(s) 
} 


每 一 次 迭代 ，range 产生 一 对 值 : 索引 和 这 个 索引 处 元 素 的 值 。 这 个 例子 里 ,我 们 不 需 
要 索引 ， 但 是 语法 上 range 循环 需要 处 理 ， 因 此 也 必须 处 理 索引 。 一 个 主意 是 我 们 将 索引 赋 
予 一 个 临时 变量 (如 temp) 然后 忽略 它 ， 但 是 Go 不 允许 存在 无 用 的 临时 变量 ， 不 然 会 出 现 
编译 错误 。 

解决 方案 是 使 用 空 标识 符 ， 它 的 名 字 是 _( 即 下 划 线 )。 空 标识 符 可 以 用 在 任何 语法 需要 
变量 名 但 是 程序 逻辑 不 需要 的 地 方 ， 例 如 丢弃 每 次 迭代 产生 的 无 用 的 索引 。 大 多 数 Go 程序 
员 喜 欢 搭配 使 用 range 和 _ 来 写 上 面 的 echo 程序 ， 因 为 索引 在 os.Args 上 面 是 隐 式 的 ， 所 以 
更 不 容易 犯错 。 

这 个 版 本 的 程序 使 用 短 的 变量 声明 来 声明 和 初始 化 s 和 sep， 但 是 我 们 可 以 等 价 地 分 开 
声明 变量 。 以 下 几 种 声明 字符 串 变 量 的 方式 是 等 价 的 : 


6 Mi 
var s string 

Var s="" 

var s string = "" 


为 什么 我 们 更 喜欢 某 一 个 ? 第 一 种 形式 的 短 变 量 声明 更 加 简洁 ， 但 是 通常 在 一 个 函数 内 
部 使 用 ， 不 适合 包 级 别 的 变量 。 第 二 种 形式 依赖 默认 初始 化 为 空 字符 串 的 "。 第 三 种 形式 很 
少 用 ， 除 非 我 们 声明 多 个 变量 。 第 四 种 形式 是 显 式 的 变量 类 型 ， 在 类 型 一 致 的 情况 下 是 元 余 
的 信息 ， 在 类 型 不 一 致 的 情况 下 是 必需 的 。 实 践 中 ,我 们 应 当 使 用 前 两 种 形式 ， 使 用 显 式 的 
初始 化 来 说 明 初 始 化 变量 的 重要 性 ， 使 用 隐 式 的 初始 化 来 表明 初始 化 变量 不 重要 。 

如 上 所 述 ， 每 次 循环 ， 字 符 串 s 有 了 新 的 内 容 。+= 语句 通过 追加 旧 的 字符 串 、 空 格 字符 
和 下 一 个 参数 ， 生 成 一 个 新 的 字符 串 ， 然 后 把 新 字符 串 赋 给 s。 旧 的 内 容 不 再 需要 使 用 ， 会 
被 例 行 垃圾 回收 。 

如 果 有 大 量 的 数据 需要 处 理 ， 这 样 的 代价 会 比较 大 。 一 个 简单 和 高 效 的 方式 是 使 用 


strings 包 中 的 Join 困 数 : 


8&op1.io/cha/echo3 
func main() { 
fmt.Println(strings.Join(os.Args[1:], " ")) 
} 


最 后 ， 如 果 我 们 不 关心 格式 ， 只 是 想 看 值 ， 或 许 只 是 调试 ， 那 么 用 Println 格式 化 结果 
就 可 以 了 : 


fmt.Println(os.Args[1:]) 


这 个 输出 语句 和 我 们 从 strings.Join 得 到 的 输出 很 像 ， 不 过 两 边 有 括号 。 任 何 slice 都 
能 够 以 这 样 的 方式 输出 。 

练习 1.1: 修改 echo 程序 输出 os.Args[e] ， 即 命令 的 名 字 。 

练习 1.2: 修改 echo 程序 ， 输 出 参数 的 索引 和 值 ， 每 行 一 个 。 

练习 1.3: 尝试 测量 可 能 低 效 的 程序 和 使 用 strings.Join 的 程序 在 执行 时 间 上 的 差异 。 
(1.6 节 有 time 包 ，11.4 节 展 示 如 何 撰写 系统 性 的 性 能 评估 测试 。) 


1.3 找 出 重复 行 


用 于 文件 复制 、 打 印 、 检 索 、 排 序 、 统 计 的 程序 ， 通 常 有 一 个 相似 的 结构 : 在 输入 接口 
上 循环 读 取 ， 然 后 对 每 一 个 元 素 进 行 一 些 计 算 ， 在 运行 时 或 者 在 最 后 输出 结果 。 我 们 展示 三 
个 版 本 的 dup 程序 ， 它 受 UNIX 的 unid 命令 启发 来 找到 相 邻 的 重复 行 。 这 个 程序 使 用 容易 
适 配 的 结构 和 包 。 

第 一 个 版 本 的 dup 程序 输出 标准 输入 中 出 现 次 数 大 于 1 的 行 ， 前 面 是 次 数 。 这 个 程序 引 
入 if 语句、map 类 型 和 bufio 包 。 


gop1.io/ch1/dup1 
// dup1 输出 标准 输入 中 出 现 次 数 大 于 1 的 行 ， 前 面 是 次 数 


package main 


import ( 
"bufio" 
"fmt" 
"os" 


) 


func main() { 
counts := make(map[string]int) 
input := bufio.NewScanner(os.Stdin) 
for input.Scan() { 
counts[input.Text()]++ 


} 

// 注意 : 忽略 input.Err() 中 可 能 的 错误 

for line, n := range counts { 
ifn>lt 

fmt.Printf("%d\t%s\n", n, line) 

} 

} 

} 


像 for 一 样 ，if 语句 中 的 条 件 部 分 也 从 不 放 在 圆 括号 里 面 ， 但 是 程序 体 中 需要 用 到 大 括 
号 。 这 里 还 可 以 有 一 个 可 选 的 else 部 分 ， 当 条 件 为 false 的 时 候 执行 。 


map 存储 一 个 键 / 值 对 集合 ， 并 且 提 供 常量 时 间 的 操作 来 存储 、 获 取 或 测试 集合 中 的 某 
个 元 素 。 键 可 以 是 其 值 能 够 进行 相等 (==) 比较 的 任意 类 型 ， 字 符 串 是 最 常见 的 例子 ; 值 可 
以 是 任意 类 型 。 这 个 例子 中 ， 键 的 类 型 是 字符 串 ， 值 是 int。 内 置 的 函数 make 可 以 用 来 新 建 
map， 它 还 可 以 有 其 他 用 途 。map 将 在 4.3 节 中 进行 更 多 讨论 。 

每 次 dup 从 输入 读 取 一 行内 容 ， 这 一 行 就 作为 map 中 的 键 ， 对 应 的 值 递增 1。 语句 
counts[input.Text()]++ 等 价 于 下 面 的 两 个 语句 : 

line := input.Text() 

counts[line] = counts[line] + 1 

键 在 map 中 不 存在 时 也 是 没有 问题 的 。 当 一 个 新 的 行 第 一 次 出 现时 ， 右 边 的 表达 式 
counts[line] 根据 值 类 型 被 推演 为 零 值 ，int 的 零 值 是 9。 

为 了 输出 结果 ， 我 们 使 用 基于 range 的 for 循环 ， 这 次 在 map 类 型 的 counts 变量 上 遍 
历 。 像 以 前 一 样 ， 每 次 迭代 输出 两 个 结果 ，map 里 面 一 个 元 素 对 应 的 键 和 值 。map 里 面 的 键 
的 迭代 顺序 不 是 固定 的 ， 通常 是 随机 的 ， 每 次 运行 都 不 一 致 。 这 是 有 意 设计 的 ， 以 防止 程序 
依赖 某 种 特定 的 序列 ， 此 处 不 对 排序 做 任何 保证 。 

下 面 讨论 bufio 包 ， 使 用 它 可 以 简便 和 高 效 地 处 理 输入 和 输出 。 其 中 一 个 最 有 用 的 特性 
是 称 为 扫描 器 (scanner) 的 类 型 ， 它 可 以 读 取 输 入 ， 以 行 或 者 单词 为 单位 断 开 ， 这 是 处 理 以 
行为 单位 的 输入 内 容 的 最 简单 方式 。 

程序 使 用 短 变量 的 声明 方式 ， 新 建 一 个 bufio.scanner 类 型 input 变量 : 


input := bufio.NewScanner(os.Stdin) 


扫描 器 从 程序 的 标准 输入 进行 读 取 。 每 一 次 调用 input.scan() 读 取 下 一 行 ， 并 且 将 结尾 
的 换行 符 去 掉 ; 通过 调用 input.Text() 来 获取 读 到 的 内 容 。scan 函数 在 读 到 新 行 的 时 候 返 回 
true， 在 没有 更 多 内 容 的 时 候 返 回 false。 

像 C 语言 或 其 他 语言 中 的 printf 一 样 ， 函 数 fmt.Printf 从 一 个 表达 式 列 表 生 成 格式 化 
的 输出 。 它 的 第 一 个 参数 是 格式 化 指示 字符 串 ， 由 它 指 定 其 他 参数 如 何 格式 化 。 每 一 个 参数 
的 格式 是 一 个 转 义 字符 、 一 个 百 分 号 加 一 个 字符 。 例 如 : %d 将 一 个 整数 格式 化 为 十 进 制 的 形 
式 ，%s 把 参数 展开 为 字符 串 变量 的 值 。 

Printf 函数 有 超过 10 个 这 样 的 转 义 字符 ，Go 程序 员 称 为 verb。 下 表 远 不 完整 ， 但 是 它 
说 明 有 很 多 可 以 用 的 功能 : 


verb 描述 

%d 十 进 制 整数 

%x，%o ，%b 十 六 进 制 、 八 进 制 、 二 进 制 整数 

%f, %g, %e 浮 点 数 : 如 3.141593，3.141592653589793，3.141593e+68 
%t 布尔 型 : true 或 false 

%c 字符 (Unicode 码 点 ) 

%s 字符 串 

%q 带 引号 字符 串 (如 "abc") 或 者 字符 (如 'c') 

%v 内 置 格式 的 任何 值 

%T 任何 值 的 类 型 


%% 百 分 号 本 身 (无 操作 数 ) 


名 和 贫 1 苹 


程序 dupl 中 的 格式 化 字符 串 还 包含 一 个 制 表 符 \t 和 一 个 换行 符 \n。 字 符 串 字面 量 可 以 
包含 类 似 转 义 序 列 (escape sequence) 来 表示 不 可 见 字 符 。Printf 默认 不 写 换行 符 。 按 照 约 
定 ， 诸 如 log.Printf 和 fmt.Errorf 之 类 的 格式 化 函数 以 f 结 尾 ， 使 用 和 fmt.Printf 相同 的 格 
式 化 规则 ; 而 那些 以 ln 结尾 的 函数 (如 Println) 则 使 用 ‰v 的 方式 来 格式 化 参数 ， 并 在 最 后 
追加 换行 符 。 

许多 程序 既 可 以 像 dup 一 样 从 标准 输入 进行 读 取 ， 也 可 以 从 具体 的 文件 读 取 。 下 一 个 版 
本 的 dup 程序 可 以 从 标准 输入 或 一 个 文件 列表 进行 读 取 ， 使 用 os.open 函数 来 逐个 打开 : 


gopl1.io/ch1/dup2 
// dup2 打印 输入 中 多 次 出 现 的 行 的 个 数 和 文本 
// 它 从 stdin 或 指定 的 文件 列表 读 取 


package main 


import ( 
"bufio" 
"fmt" 
"os" 


) 


func main() { 
counts := make(map[string]int) 
files := os.Args[1:] 
if len(files) == 6 { 
countLines(os.Stdin, counts) 
} else { 
for _, arg := range files { 
f, err := os.Open(arg) 
if err != nil { 


fmt.Fprintf(os.Stderr, "dup2: %v\n", err) 
continue 
} 
countLines(f, counts) 
f.Close() 
} 
for line, n := range counts { 
二 并 
fmt.Printf("%d\t%s\n", n, line) 
} 
} 
} 
func countLines(f *os.File, counts map[string]int) { 
input := bufio.NewScanner(f) 


for input.Scan() { 
counts[input.Text()]++ 


小 
// 注意 : 忽略 input.Err() 中 可 能 的 错误 


函数 os.open 返回 两 个 值 。 第 一 个 是 打开 的 文件 (*os.File)， 该 文件 随后 被 scanner 读 取 。 

第 二 个 返回 值 是 一 个 内 置 的 error 类 型 的 值 。 如 果 err 等 于 特殊 的 内 置 nil 值 ， 标 准 文 
件 成 功 打开 。 文 件 在 被 读 到 结尾 的 时 候 ，close 函数 关闭 文件 ， 然 后 释放 相应 的 资源 (内存 
等 )。 男 一 方面 ， 如 果 err 不 是 nil， 说 明 出 错 了 。 这 时 ，error 的 值 描述 错误 原因 。 简 单 的 
错误 处 理 是 使 用 Fprintf 和 ‰v 在 标准 错误 流 上 输出 一 条 消息 ，%v 可 以 使 用 默认 格式 显示 任意 
类 型 的 值 ; 错误 处 理 后 ，dup 开始 处 理 下 一 个 文件 ; continue 语句 让 循环 进入 下 一 个 迭代 。 


为 了 保持 示例 代码 简短 ， 这 里 对 错误 处 理 有 意 进 行 了 一 定 程度 的 忽略 。 很 明显 ， 必 须 检 
查 os.open 返回 的 错误 ; 但 是 ,我们 忽略 了 使 用 input.scan 读 取 文件 的 过 程 中 出 现 概 率 很 小 
的 错误 。 我 们 将 标记 所 跳 过 的 错误 检查 ，5.4 节 将 更 详细 地 讨论 错误 处 理 。 

值得 注意 的 是 ， 对 countLines 的 调用 出 现在 其 声明 之 前 。 函 数 和 其 他 包 级 别 的 实体 可 以 
以 任意 次 序 声明 。 

map 是 一 个 使 用 make 创建 的 数据 结构 的 引用 。 当 一 个 map 被 传递 给 一 个 函数 时 ， 函 数 
接收 到 这 个 引用 的 副本 ， 所 以 被 调用 函数 中 对 于 map 数据 结构 中 的 改变 对 函数 调用 者 使 用 
的 map 引用 也 是 可 见 的 。 在 示例 中 ，countLines 函数 在 counts map 中 插入 的 值 ， 在 main 肯 
数 中 也 是 可 见 的 。 

这 个 版 本 的 dup 使 用 “ 流 式 ”模式 读 取 输 入 ， 然 后 按 需 拆 分 为 行 ， 这 样 原 理 上 这 些 程序 
可 以 处 理 海量 的 输入 。 一 个 可 选 的 方式 是 一 次 读 取 整 个 输入 到 大 块 内 存 ， 一 次 性 地 分 割 所 有 
行 ， 然 后 处 理 这 些 行 。 接 下 去 的 版 本 dup3 将 以 这 种 方式 处 理 。 这 里 引入 一 个 ReadFile 函数 
(从 io/ioutil 包 )， 它 读 取 整 个 命名 文件 的 内 容 ， 还 引入 一 个 strings.split 函数 ， 它 将 一 个 字 
符 串 分 割 为 一 个 由 子 串 组 成 的 slice。(split 是 前 面 介绍 过 的 strings.Join 的 反 操作 。) 

我 们 在 某 种 程度 上 简化 了 dup3 : 第 一 ， 它 仅 读 取 指 定 的 文件 ， 而 非 标准 输入 ， 因 为 
ReadFile 需要 一 个 文件 名 作为 参数 ; 第 二 ， 我 们 将 统计 行 数 的 工作 放 回 main 函数 中 ， 因 为 它 
当前 仅 在 一 处 用 到 。 


gopl1.io/ch1/dup3 
package main 


import ( 
"fmt" 
"io/ioutil" 
"os" 
"strings" 
) 
func main() { 
counts := make(map[string]int) 
for _, filename := range os.Args[1:] { 
data, err := ioutil.ReadFile(filename) 
if err l= nil { 
fmt.Fprintf(os.Stderr, "dup3: %v\n", err) 
continue 
上 
for _, line := range strings.Split(string(data), "\n") { 
counts[line]++ 
} 
for line, n := range counts { 
i 
fmt.Printf("%d\t%s\n", n, line) 
} 
} 


ReadFile 函数 返回 一 个 可 以 转化 成 字符 串 的 字 节 slice， 这 样 它 可 以 被 strings.split 分 
割 。3.5.4 节 将 详细 讨论 字符 串 和 字 节 slice。 

实际 上 ，bufio.scanner 、ioutil.ReadFile 以 及 ioutil.writeFile 使 用 *os.File 中 的 Read 
和 write 方法 ， 但 是 大 多 数 程序 员 很 少 需要 直接 访问 底层 的 例 程 。 像 bufio 和 io/ioutil 包 中 
上 层 的 方法 更 易 使 用 。 


练习 1.4: 修改 dup2 程序 ， 输 出 出 现 重复 行 的 文件 的 名 称 。 


1.4 ”GIF 动画 


下 一 个 程序 展示 Go 标准 的 图 像 包 的 使 用 ， 用 来 创建 一 系列 的 位 图 图 像 ， 然 后 将 位 图 序 
列 编码 为 GIF 动画 。 下 面 的 图 像 叫 作 利 萨 若 图 形 ， 是 20 世纪 60 年 代 科幻 片 中 的 纤维 状 视 
觉 效 果 。 利 萨 茹 图 形 是 参数 化 的 二 维 谐振 曲线 ， 如 示波器 x 轴 和 yy 轴 馈 电 输入 的 两 个 正弦 
波 。 图 1-1 是 几 个 示例 。 


全 


图 1-1 四 种 利 萨 茹 图 形 


这 段 代码 里 有 几 个 新 的 组 成 ， 包 括 const 声明 、 结 构 体 以 及 复合 字面 量 。 不 像 大 多 数 例 
子 ， 本 例 还 引入 了 浮 点 运算 。 这 个 示例 的 主要 目的 是 提供 一 些 思路 ， 表 明 Go 语言 看 起 来 是 
怎样 的 ， 以 及 利用 Go 语言 和 它 的 库 可 以 轻易 完成 哪些 事情 ， 这 里 只 简短 地 讨论 这 几 个 主 
题 ， 更 多 细节 将 放 在 后 面 章节 。 


gopl1. io/ch1/1issajous 
// lissajous 产生 随机 利 萨 茹 图 形 的 GIF 动画 


package main 



















import ( 
"image" 
"image/color" 
"image/gif" 
"io" 
"math" 
"math/rand" 
"os" 


) 


var palette = []color.Color{color.White, color.Black} 
const ( 
whiteIndex = 8 // 画板 中 的 第 一 种 颜色 
blackIndex = 1 // 画板 中 的 下 一 种 颜色 
) 
func main() { 
rand.Seed(time.Now().UTC().UnixNano()) 


if len(os.Args) > 1 && os.Args[1] == "web" { 
handler := func(w http.ResponseWriter, r *http.Request) { 
lissajous(w) 


http.HandleFunc("/", handler) 
log.Fatal(http.ListenAndServe("localhost:86060", nil)) 
return 


} 


lissajous(os.Stdout) 


func lissajous(out io.Writer) { 


const ( 
cycles =5 // 完整 的 x 振荡 器 变化 的 个 数 
res = 6.661 // 角度 分 辩 率 
size = 166  // 图 像 画 布 包 含 [-size. .+size] 
nframes = 64 // 动画 中 的 帧 数 
delay =8 // 以 16ms 为 单位 的 帧 间 延 迟 


) 
freq := rand.Float64() * 3.8 // y 振荡 器 的 相对 频率 
anim := gif.GIF{LoopCount: nframes} 
phase := 6.6 // phase difference 
for i := 6; i «< nframes; i++ { 
rect := image.Rect(0, 0, 2*size+1, 2*size+1) 
img := image.NewPaletted(rect, palette) 
for t := 0.0; t < cycles*2*math.Pi; t += res { 
x := math.Sin(t) 
y := math.Sin(t*freq + phase) 
img.SetColorIndex(size+int(x*size+0.5), size+int(y*size+0.5), 
blackIndex) 


phase += 80.1 
anim.Delay = append(anim.Delay，delay) 
anim.Image = append(anim.Image, img) 


: py &anim) // 注 意 : 忽略 编码 错误 

在 导入 那些 由 多 段 路 径 如 image/color 组 成 的 包 之 后 ， 使 用 路 径 最 后 的 一 段 来 引用 这 个 
包 。 所 以 变量 color .White 属于 image/color 包 ，gif.GIF 属于 image/gif 包 。 

const 声明 (参考 3.6 节 ) 用 来 给 常量 命名 ， 常 量 是 其 值 在 编译 期 间 固定 的 量 ， 例 如 周 
期 、 帧 数 和 延迟 等 数值 参数 。 与 var 声明 类 似 ，const 声明 可 以 出 现在 包 级 别 (所 以 这 些 常 
量 名 字 在 包 生 命 周 期 内 都 是 可 见 的 ) 或 在 一 个 函数 内 (所 以 名 字 仪 在 函数 体内 可 见 )。 常 量 
必须 是 数字 、 字 符 串 或 布尔 值 。 

表达 式 []color.Ccolor{...} 和 gif.6IF{...} 是 复合 字面 量 (参考 4.2 节 、4.4.1 节 )， 即 用 一 系 
列 元 素 的 值 初始 化 Go 的 复合 类 型 的 紧凑 表达 方式 。 这 里 ， 第 一 个 是 slice， 第 二 个 是 结构 体 。 

gif.GIF 是 一 个 结构 体 类 型 (参考 4.4 节 )。 结 构 体 由 一 组 称 为 字段 的 值 组 成 ， 字 段 通常 
有 不 同 的 数据 类 型 ， 它 们 一 起 组 成 单个 对 象 ， 作 为 一 个 单位 被 对 待 。anim 变量 是 gif.GIF 结 
构 体 类 型 。 这 个 结构 体 字 面 量 创建 一 个 结构 体 Loopceunt ， 其 值 设置 为 nframes ; 其 他 字段 的 
值 是 对 应 类 型 的 零 值 。 结 构 体 的 每 个 字段 可 以 通过 点 记 法 来 访问 ， 在 最 后 两 个 赋值 语句 中 ， 
显 式 更 新 anim 结构 体 的 Delay 和 Image 字段 。 

lissajous 函数 有 两 个 嵌 套 的 循环 。 外 层 有 64 个 迄 代 ， 每 个 迭代 产生 一 个 动画 帧 。 它 创 
建 一 个 201 x 201 大 小 的 画板 ,使 用 黑 和 白 两 种 颜色 。 所 有 的 像素 值 默 认 设置 为 0 (画板 中 的 
初始 化 颜色 )， 这 里 设置 为 白色 。 每 一 个 内 层 循环 通过 设置 一 些 像素 为 黑色 产生 一 个 新 的 图 
像 。 结 果 使 用 内 置 的 append 参数 将 其 追加 到 anim 的 帧 列表 中 ， 并 且 指 定 80ms 的 延迟 。 最 
后 帧 和 延迟 的 序列 被 编码 成 GIF 格式 ， 然 后 写 人 输出 流 out。out 的 类 型 是 io.writer， 它 可 
以 帮 有 我 们 输出 到 很 多 地 方 ， 稍 后 即 可 看 到 。 

外 层 循 环 运行 两 个 振荡 器 。x 方向 的 振荡 器 是 正弦 函数 ，? 方向 也 是 正弦 化 的 ， 但 是 它 
的 频率 相对 于 x 的 振动 周期 是 0 一 3 之 间 的 一 个 随机 数 ， 它 的 相位 相对 于 x 的 初始 值 为 0， 
然后 随 着 每 个 动画 帧 增加 。 该 循环 在 x 振荡 器 完成 5 个 完整 周期 后 停止 。 每 一 步 它 都 调用 


12 锚 1 缆 


SetColorIndex 将 对 应 画板 上 面 的 (x, y) 位 置 涂 为 黑色 ， 在 画板 上 的 值 为 1。 
main 因数 调用 lissajous 函数 ， 直 接 写 到 标准 输出 ， 所 以 这 个 命令 产生 一 个 像 图 1-1 那 
样 的 GIF 动画 : 


$ go build gopl.io/ch1/lissajous 
$ ./lissajous >out.gif 


练习 1.5 : 改变 利 萨 茹 程序 的 画板 颜色 为 绿色 黑 底 来 增加 真实 性 。 使 用 color .RGBA 
{8xRR,ex66,8x8B,exff} 创建 一 种 Web 颜色 #RR6688， 每 一 对 十 六 进 制 数字 表示 组 成 一 个 像素 
红 、 绿 、 蓝 分 量 的 亮度 。 

练习 1.6 : 通过 在 画板 中 添加 更 多 颜色 ， 然 后 通过 有 趣 的 方式 改变 setcolorIndex 的 第 三 
个 参数 ， 修 改 利 萨 茹 程序 来 产生 多 种 色彩 的 图 片 。 


1.5 获取 一 个 URL 


对 许多 应 用 而 言 ， 访 问 互 联网 上 的 信息 和 访问 本 地 文件 系统 一 样 重 要 。Go 提供 了 一 系 
列 包 , 在 net 包 下 面 分 组 管理 ， 使 用 它们 可 以 方便 地 通过 互联 网 发 送 和 接收 信息 ， 使 用 底层 
的 网 络 连接 ， 创 建 服务 器 ， 此 时 Go 的 并 发 特性 ( 见 第 8 章 ) 特别 有 用 。 

程序 fetch 展示 从 互联 网 获取 信息 的 最 小 需求 ， 它 获取 每 个 指定 URL 的 内 容 ， 然 后 不 
加 解析 地 输出 。fetch 来 自 curl 这 个 非常 重要 的 工具 。 显 然 可 以 使 用 这 些 数据 做 更 多 的 事情 ， 
但 这 里 只 讲 基 本 的 思路 ， 本 书 将 会 频繁 用 到 这 个 程序 : 


gopl.io/ch1/fetch 
// fetch 输出 从 URL 获取 的 内 容 


package main 


import ( 
"fmt" 
"io/ioutil" 
"net/http" 
"os" 

) 


func main() { 
for _, url := range os.Args[1:] { 
resp, err := http.Get(url) 


if err != nil { 
fmt.Fprintf(os.Stderr, "fetch: %v\n", err) 
os.Exit(1) 

} 


b, err := ioutil.ReadAll(resp.Body) 

resp.Body.Close() 

if err != nil { 
fmt.Fprintf(os.Stderr, "fetch: reading %s: %v\n", url, err) 
os.Exit(1) 


} 
fmt.Printf("%s", b) 
} 
} 
这 个 程序 使 用 的 函数 来 自 两 个 包 : net/http 和 io/ioutil。http.Get 函数 产生 一 个 HTTP 
请 求 ， 如 果 没 有 出 错 ， 返 回 结 果 存 在 响应 结构 resp 里 面 。 其 中 resp 的 Body 域 包 含 服务 器 端 
响应 的 一 个 可 读 取 数据 流 。 随 后 ioutil.ReadAll 读 取 整个 响应 结果 并 存 人 b。 关 闭 Body 数据 


流 来 避免 资源 泄漏 ， 使 用 Printf 将 响应 输出 到 标准 输出 。 


$ go build gop1.io/ch1/fetch 

$ ./fetch http://gopl.io 

<html> 

<head> 

<title>The Go Programming Language</title> 


如 果 HTTP 请 求 失败 ，fetch 报告 失败 : 


$ ./fetch http://bad.gopl.io 

fetch: Get http://bad.gopl.io: dial tcp: lookup bad.gopl.io: no such host 

无 论 哪 种 错误 情况 ，os.Exit(1) 会 在 进程 退出 时 返回 状态 码 1。 

练习 1.7: 函数 io.copy(dst,src) 从 src 读 ， 并且 写 入 dst。 使 用 它 代 蔡 ioutil.ReadAll 来 
复制 响应 内 容 到 os.stdout， 这 样 不 需要 装 下 整个 响应 数据 流 的 缓冲 区 。 确 保 检查 io.copy 返 
回 的 错误 结果 。 

练习 1.8: 修改 fetch 程序 添加 一 个 http:// 前 级 (假如 该 URL 参数 缺失 协议 前 缀 )。 可 
能 会 用 到 strings .HasPrefix。 


练习 1.9: 修改 fetch 来 输出 HTTP 的 状态 吗 ， 可 以 在 resp.status 中 找到 它 。 


1.6 并 发 获取 多 个 URL 


Go 最 令 人 感 兴 趣 和 新 颖 的 特点 是 支持 并 发 编程 。 这 是 一 个 大 话题 ， 第 8 章 和 第 9 章 将 
专门 讨论 ， 所 以 此 处 只 是 简单 了 解 一 下 Go 主要 的 并 发 机 制 、goroutine 和 通道 (channel) 。 

下 一 个 程序 fetchall 和 前 一 个 一 样 获取 URL 的 内 容 ， 但 是 它 并 发 获取 很 多 URL 内 容 ， 
于 是 这 个 进程 使 用 的 时 间 不 超过 耗 时 最 长 时 间 的 获取 任务 ， 而 不 是 所 有 获取 任务 总 的 时 间 。 
这 个 版 本 的 fetchall 丢弃 响应 的 内 容 ， 但 是 报告 每 一 个 响应 的 大 小 和 花费 的 时 间 : 


gopl1.io/ch1/fetchall 
// fetchall 并 发 获取 URL 并 报告 它们 的 时 间 和 大 小 


package main 





import ( 

"fmt" 

"io" 
"io/ioutil" 
"net/http" 
"oes" 

"time" 


) 


func main() { 
start := time.Now() 
ch := make(chan string) 
for _, url := range os.Args[1:] { 
go fetch(url，ch) // 启动 一 个 goroutine 


for range os.Args[1:] { 
fmt.Println(<-ch) // 从 通道 ch 接收 


fmt.Printf("%.2fs elapsed\n", time.Since(start).Seconds()) 
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func fetch(url string, ch chan<- string) { 
start := time.Now() 
resp, err := http.Get(url) 


if err != nil { 
ch <- fmt.Sprint(err) // 发 送 到 通道 ch 
return 

} 


nbytes, err := io.Copy(ioutil.Discard, resp.Body) 
resp.Body.Close() // 不 要 泄露 资源 


if err != nil { 
ch <- fmt.Sprintf("while reading %s: %v", url, err) 
return 

} 


secs := time.Since(start).Seconds() 
ch <- fmt.Sprintf("%.2fs %7d %s", secs, nbytes, url) 
} 


这 有 一 个 例子 : 


$ go build gopl.io/ch1i/fetchall 
$ ./fetchall https://golang.org http://gopl.io https://godoc.org 


8.14s 6852 https://godoc.org 
8.16s 7261 https://golang.org 
8.48s 2475 http://gopl.io 


9.48s elapsed 


goroutine 是 一 个 并 发 执行 的 函数 。 通 道 是 一 种 允许 某 一 例 程 向 另 一 个 例 程 传递 指定 类 
型 的 值 的 通信 机 制 。main 函数 在 一 个 goroutine 中 执行 ， 然 后 go 语句 创建 额外 的 goroutine。 

main 因数 使 用 make 创建 一 个 字符 串通 道 。 对 于 每 个 命令 行 参数 ，go 语句 在 第 一 轮 循 环 
中 启动 一 个 新 的 goroutine， 它 异步 调用 fetch 来 使 用 http.Get 获取 URL 内 容 。io.copy 函数 
读 取 响应 的 内 容 ， 然 后 通过 写 人 ioutil.piscard 输出 流 进行 丢弃 。copy 返回 字 节 数 以 及 出 现 
的 任何 错误 。 每 一 个 结果 返回 时 ，fetch 发 送 一 行 汇总 信息 到 通道 ch。main 中 的 第 二 轮 循环 
接收 并 且 输 出 那些 汇总 行 。 

当 一 个 goroutine 试图 在 一 个 通道 上 进行 发 送 或 接收 操作 时 ， 它 会 阻塞 ， 直 到 另 一 个 
goroutine 试图 进行 接收 或 发 送 操作 才 传 递 值 ， 并 开始 处 理 两 个 goroutine。 本 例 中 ， 每 一 个 
fetch 在 通道 ch 上 发 送 一 个 值 (ch <- expression)，main 函数 接收 它们 (<-ch)。 由 main 来 处 
理 所 有 的 输出 确保 了 每 个 goroutine 作为 一 个 整体 单元 处 理 ， 这 样 就 避免 了 两 个 goroutine 同 
时 完成 造成 输出 交织 所 带 来 的 风险 。 : 

练习 1.10: 找 一 个 产生 大 量 数据 的 网 站 。 连 续 两 次 运行 fetchal11， 看 报告 的 时 间 是 否 会 
有 大 的 变化 ， 调 查 缓存 情况 。 每 一 次 获取 的 内 容 一 样 吗 ? 修改 fetchall 将 内 容 输 出 到 文件 ， 
这 样 可 以 检查 它 是 否 一 致 。 

练习 1.11: 使 用 更 长 的 参数 列表 来 尝试 fstchall， 例 如 使 用 alexa.com 排名 前 100 万 的 
网 站 。 如 果 一 个 网 站 没有 响应 ， 程 序 的 行为 是 怎样 的 ? ( 8.9 节 会 通过 复制 这 个 例子 来 描述 
响应 的 机 制 。) 


1.7 一 个 Web 服务 器 


使 用 Go 的 库 非 常 容易 实现 一 个 Web 服务 器 ， 用 来 响应 像 fetch 那样 的 客户 端 请 求 。 本 
节 将 展示 一 个 迷你 服务 器 ， 返 回访 问 服务 器 的 URL 的 路 径 部 分 。 例 如 ， 如 果 请 求 的 URL 是 


http://1localhost:8868/hello， 响 应 将 是 URL.Path = "/hello"。 


gopl.io/ch1/server1 
// server1l 是 一 个 迷你 回声 服务 器 


package main 


import ( 
"fmt" 
"log" 
"net/http" 
) 


func main() { 
http.HandleFunc("/"，handler) // 回声 请 求 调用 处 理 程序 
log.Fatal(http.ListenAndServe("localhost:86680", nil)) 
} 


// 处 理 程序 回 显 请 求 URL r 的 路 径 部 分 


func handler(w http.ResponseWriter, r *http.Request) { 
fmt.Fprintf(w, "URL.Path = %q\n", r.URL.Path) 


} 

这 个 程序 只 有 宴 窒 几 行 代 码 ， 因 为 库 函 数 做 了 大 部 分 工作 。main 函数 将 一 个 处 理 函 数 和 
以 /开头 的 URL 链接 在 一 起 ， 代 表 所 有 的 URL 使 用 这 个 函数 处 理 ， 然 后 启动 服务 器 监听 进 
入 8000 端口 处 的 请 求 。 一 个 请 求 由 一 个 http.Request 类 型 的 结构 体 表示 ， 它 包含 很 多 关联 
的 域 ， 其 中 一 个 是 所 请 求 的 URL。 当 一 个 请 求 到 达 时 ， 它 被 转交 给 处 理 函 数 ， 并 从 请 求 的 
URL 中 提取 路 径 部 分 ( /hello)， 使 用 fmt.Printf 格式 化 ， 然 后 作为 响应 发 送 回去 。Web 服 
务 器 将 在 7.7 节 进 行 详细 讨论 。 

让 我 们 在 后 台 启 动 服 务 器 。 在 Mac OS X 或 者 Linux 上 ， 在 命令 行 后 添加 一 个 & 符号 ; 
在 微软 Windows 上 ， 不 需要 & 符号 ， 而 需要 单独 开启 一 个 独立 的 命令 行 窗 口 。 


$ go run src/gop1.io/chl1/server1/main.go & 


可 以 从 命令 行 发 起 客户 请 求 : [ene eh 


人 人 从 iiocalhost -8000 ER 


$ go build gop1l.io/ch1/fetch 

$ ./fetch http://1L1ocalhost:8666 
URL.Path = "/" 

$ ./fetch http://1Localhost:8666/help 
URL .Path = "/help" 


另外 ， 还 可 以 通过 浏览 器 进行 访问 ， 如 图 1-2 所 示 。 

为 服务 器 添加 功能 很 容易 。 一 个 有 用 的 扩展 是 一 个 特定 的 URL， 它 返回 某 种 排序 的 状 
态 。 例 如 ， 这 个 版 本 的 程序 完成 和 回声 服务 器 一 样 的 事情 ， 但 同时 返回 请 求 的 数量 ;，URL 
/count 请 求 返回 到 现在 为 止 的 个 数 ， 去 掉 /count 请 求 本 身 : 

gop1.io/ch1/server2 
// server2 是 一 个 迷你 的 回声 和 计数 器 服务 器 


package main 


URL . path = 1 





图 1-2 来 自 回声 服务 器 的 响应 


import ( 
“fm 
"log" 
"net/http" 
"Sync” 

) 


var mu sync.Mutex 
var count int 
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func main() { 
http.HandleFunc("/", handler) 
http.HandleFunc("/count", counter) 
log.Fatal(http.ListenAndServe("localhost:86660", nil)) 
} 


// 处 理 程序 回 显 请 求 的 URL 的 路 径 部 分 
func handler(w http.ResponseWriter, r *http.Request) { 
mu.Lock() 
count++ 
mu.Unlock() 
fmt.Fprintf(w, "URL.Path = %q\n", r.URL.Path) 
} 


// counter 回 显 目 前 为 止 调 用 的 次 数 
func counter(w http.ResponseWriter, r *http.Request) { 
mu.Lock() 


fmt.Fprintf(w, "Count %d\n", count) 
mu.Unlock() 
} 


这 个 服务 器 有 两 个 处 理 函数 ， 通 过 请 求 的 URL 来 决定 哪 一 个 被 调用 : 请 求 /count 调 
用 counter， 其 他 的 调用 handler。 以 / 结尾 的 处 理 模 式 匹 配 所 有 含有 这 个 前 级 的 URL。 在 后 
台 ， 对 于 每 个 传人 的 请 求 ， 服 务 器 在 不 同 的 goroutine 中 运行 该 处 理 函数 ， 这 样 它 可 以 同时 
处 理 多 个 请 求 。 然 而 ， 如 果 两 个 并 发 的 请 求 试图 同时 更 新 计数 值 count， 它 可 能 会 不 一 致 地 
增加 ， 程 序 会 产生 一 个 严重 的 竞 态 bug (参考 9.1 节 )。 为 避免 该 问题 ， 必 须 确 保 最 多 只 有 一 
个 goroutine 在 同一 时 间 访 问 变量 ， 这 正 是 mu.Lock() 和 mu.unlock() 语句 的 作用 。 第 9 章 将 
更 细致 地 讨论 共享 变量 的 并 发 访问 。 

作为 一 个 更 完整 的 例子 ， 处 理 函数 可 以 报告 它 接收 到 的 消息 头 和 表单 数据 ， 这 样 可 以 方 
便服 务 器 审查 和 调试 请 求 : 


gopl.io/ch1/server3 


// 处 理 程序 回 显 HTTP 请 求 
func handler(w http.ResponseWriter, r *http.Request) { 
fmt.Fprintf(w, "%s %s %s\n", r.Method, r.URL, r.Proto) 
for k, v := range r.Header { 
fmt.Fprintf(w, "Header[%q] = %q\n", k, v) 


fmt.Fprintf(w, "Host = %q\n", r.Host) 

fmt.Fprintf(w, "RemoteAddr = %q\n", r.RemoteAddr) 

if err := r.ParseForm(); err != nil { 
log.Print(err) 


} 
for k, v := range r.Form { 

fmt.Fprintf(w, "Form[%q] = %q\n", k, v) 
上 


} 
这 里 使 用 http.Request 结构 体 的 成 员 来 产生 类 似 下 面 的 输出 : 


GET /?q=query HTTP/1.1 

Header["Accept-Encoding"] = ["gzip, deflate, sdch"] 
Header["Accept-Language"] = ["en-US,en;q=0.8"] 

Header["Connection"] = ["keep-alive"] 

Header["Accept"] = ["text/html,application/xhtml+xml,application/xml;..."] 
Header["User-Agent"] = ["Mozilla/5.6 (Macintosh; Intel Mac 0S X 18 7 5)..."] 
Host = "1ocalhost:8666" 


RemoteAddr = "127.0.0.1:59911" 

Form["q"] = ["query"] 

注意 这 里 是 如 何在 让 语句 中 髋 套 调 用 ParseForm 的 。Go 允许 一 个 简单 的 语句 (如 一 个 局 
部 变量 声明 ) 跟 在 if 条 件 的 前 面 ， 这 在 错误 处 理 的 时 候 特 别 有 用 。 也 可 以 这 样 写 : 

err := r.ParseForm() 


if err != nil { 
log.Print(err) 


但 是 合并 的 语句 更 短 而 且 可 以 缩小 err 变量 的 作用 域 ， 这 是 一 个 好 的 实践 。2.7 节 将 介绍 作 
用 域 。 

这 些 程 序 中 ， 我 们 看 到 了 作为 输出 流 的 三 种 非常 不 同 的 类 型 。fetch 程序 复制 HTTP 响 
应 到 文件 os.stdout， 像 lissajous 一 样 ; fetchall 程序 通过 将 响应 复制 到 ioutil1.Discard 中 
进行 丢弃 (在 统计 其 长 度 时 ) ; Web 服务 器 使 用 fmt.Fprintf 通过 写 人 http.Responsewriter 来 
让 浏览 器 显示 。 

尽管 三 种 类 型 细节 不 同 ,但 都 满足 一 个 通用 的 接口 (interface)， 该 接口 允许 它们 按 需 使 
用 任何 一 种 输出 流 。 该 接口 ( 称 为 io.writer) 将 在 7.1 节 进 行 讨论 。 

Go 的 接口 机 制 是 第 7 章 的 内 容 ， 但 是 为 了 说 明 它 可 以 做 什么 ,我 们 来 看 一 下 整合 Web 
服务 器 和 lissajous 函数 是 一 件 多 么 容易 的 事情 ， 这 样 GIF 动画 将 不 再 输出 到 标准 输出 而 是 
HTTP 客户 端 。 简 单 添加 这 些 行 到 Web 服务 器 : 


handler := func(w http.ResponseWriter, r *http.Request) { 
lissajous(w) 


} 
http.HandleFunc("/", handler) 


或 者 也 可 以 : 


http.HandleFunc("/", func(w http.ResponseWriter, r *http.Request) { 
lissajous(w) 
}) 
上 面 HandleFunc 函数 中 立即 调用 的 第 二 个 参数 是 函数 字面 量 ， 这 是 一 个 在 该 场景 中 使 用 
它 时 才 定义 的 匿名 函数 ， 这 将 在 5.6 节 进 一 步 解释 。 | as 
一 旦 你 完成 这 个 改变 ， 就 可 以 通过 浏览 器 访问 >” /Domo > 


localhost;8000/ 
Dd 


http://localhost:88699。 每 次 加 载 页面 ， 你 将 看 到 一 ee 
个 类 似 图 1-3 的 动画 。 XXX 


练习 1.12 : 修改 利 萨 茹 服务 器 以 通过 URL 参 中 
由 


i 


数 读 取 参 数值 。 例 如 ， 你 可 以 通过 调整 它 ， 使 得 像 
http://localhost:8666/?cycles=26 这 样 的 网 址 将 其 周 
期 设置 为 20， 以 替代 默认 的 $。 使 用 strconv.Atoi 
函数 来 将 字符 串 参 数 转化 为 整 型 。 可 以 通过 go doc 


WY 


strconv.Atoi 来 查看 文档 。 图 1-3 浏览 器 中 的 动态 利 萨 茹 图 形 


1.8 其 他 内 容 
Go 里 面 的 东西 远 比 这 个 快速 入 门 中 介绍 的 多 。 这 里 是 一 些 很 少 提 及 或 者 完全 忽略 掉 的 





主题 ， 下 面 简 单 地 介绍 一 下 这 些 主题 ， 以 便 读者 在 用 到 时 能 够 熟悉 这 些 内 容 。 
控制 流 : 我 们 前 面 介绍 了 两 个 基础 的 控制 语句 if 和 for， 但 没有 介绍 switch 语句 ， 它 是 
多 路 分 支 控 制 。 这 里 有 一 个 例子 : 


switch coinflip() { 
case "heads": 
heads++ 
case "tails": 
tails++ 
default: 
fmt.Println("landed on edge!") 
} 


coinflip 的 调用 结果 会 和 每 一 个 条 件 的 值 进行 比较 。case 语句 从 上 到 下 进行 推演 ， 所 
以 第 一 个 匹配 的 case 语句 会 被 执行 。 如 果 没 有 其 他 的 case 语句 符合 条 件 ， 那 么 可 选 的 默认 
case 语句 将 被 执行 。 默 认 case 语句 可 以 放 在 任何 地 方 。case 语句 不 像 C 语言 那样 从 上 到 下 
贯穿 执行 (尽管 有 一 个 很 少 使 用 的 fallthrough 语句 可 以 改写 这 个 行为 )。 
switch 语句 不 需要 操作 数 ， 它 就 像 一 个 case 语句 列表 ， 每 条 case 语句 都 是 一 个 布尔 表 
达 式 : 
func Signum(x int) int { 
switch { 
case x > 6: 
return +1 
default: 
return 6 


case x < 6: 
return -1 


} 
} 


这 种 形式 称 为 无 标签 (tagless) 选择 ， 它 等 价 于 switch true。 

与 for 和 if 语句 类 似 ，switch 可 以 包含 一 个 可 选 的 简单 语句 : 一 个 短 变 量 声明 ， 一 个 递 
增 或 赋值 语句 ， 或 者 一 个 函数 调用 ， 用 来 在 判断 条 件 前 设置 一 个 值 。 

break 和 continue 语句 可 以 改变 控制 流 。break 可 以 打 断 for 、switch 或 select 的 最 内 层 
调用 ， 开 始 执行 下 面 的 语句 。 正 如 我 们 在 1.3 节 中 看 到 的 ，continue 可 以 让 for 的 内 层 循环 
开始 新 的 迭代 。 语 名 可 以 标签 化 ， 这 样 方便 break 和 continue 引用 它们 来 跳出 多 层 嵌 套 的 循 
环 ， 或 者 执行 最 外 层 循环 的 迭代 。 这 里 还 有 一 个 goto 语句 ， 通 常 在 机 器 生成 的 代码 中 使 用 ， 
程序 员 一 般 不 用 它 。 

命名 类 型 : type 声明 给 已 有 类 型 命名 。 因 为 结构 体 类 型 通常 很 长 ， 所 以 它们 基本 上 都 独 
立 命名 。 一 个 熟悉 的 例子 是 定义 一 个 2D 图 形 系统 的 Point 类 型 . 


type Point struct { 


XxX, Y int 
} 
var p Point 
类 型 声明 和 命名 将 在 第 2 章 讲述 。 


指针 : Go 提供 了 指针 ， 它 的 值 是 变量 的 地 址 。 在 一 些 语言 (比如 C) 中 ， 指 针 基本 是 没 
有 约束 的 。 其 他 语言 中 ， 指 针 称 为 “引用 ”， 并 且 除 了 到 处 传递 之 外 ， 它 不 能 做 其 他 的 事情 。 
Go 做 了 一 个 折 中 ， 指 针 显 式 可 见 。 使 用 & 操作 符 可 以 获取 一 个 变量 的 地 址 ， 使 用 * 操作 符 


可 以 获取 指针 引用 的 变量 的 值 ， 但 是 指针 不 支持 算术 运算 。 这 将 在 2.3.2 节 进 行 介 绍 。 

方法 和 接口 : 一 个 关联 了 命名 类 型 的 函数 称 为 方法 。Go 里 面 的 方法 可 以 关联 到 几乎 所 
有 的 命名 类 型 。 方 法 在 第 6 章 讲述 。 接 口 可 以 用 相同 的 方式 处 理 不 同 的 具体 类 型 的 抽象 类 
型 ， 它 基于 这 些 类 型 所 包含 的 方法 ， 而 不 是 类 型 的 描述 或 实现 。 接 口 是 第 7 章 的 主题 。 

包 : Go 自 带 一 个 可 扩展 并 且 实 用 的 标准 库 ，Go 社区 创建 和 共享 了 更 多 的 库 。 编 程 时 ， 
更 多 使 用 现 有 的 包 ， 而 不 是 自己 写 所 有 的 源码 。 本 书 将 指出 一 些 比较 重要 的 标准 库 包 ,但 是 
这 些 包 太 多 了 ， 本 书 无 法 一 一 展示 ， 并 且 也 无 法 提供 诸如 包 的 完整 参考 手册 之 类 的 东西 。 

在 着 手 新 程序 前 ， 看 看 是 否 已 经 有 现成 的 包 。 可 以 在 https://golang.org/pkg 找到 标准 
库 包 的 索引 ， 社 区 贡献 的 包 可 以 在 https://godoc.org 找到 。 使 用 go doc 工具 可 以 方便 地 通 
过 命令 行 访问 这 些 文档 : 

$ go doc http.ListenAndServe 

package http // import "net/http" 

func ListenAndServe(addr string, handler Handler) error 


ListenAndServe listens on the TCP network address addr and then 
calls Serve with handler .to handle requests on incoming connections. 


注释 : 我 们 已 经 在 程序 或 包 的 开始 提 到 文档 注释 。 在 声明 任何 函数 前 ， 写 一 段 注释 来 说 
明 它 的 行为 是 一 个 好 的 风格 。 这 个 约定 很 重要 ， 因 为 它们 可 以 被 go doc 和 godoc 工具 定位 和 
作为 文档 显示 (参考 10.7.4 节 )。 

对 于 跨越 多 行 的 注释 ， 可 以 使 用 类 似 其 他 语言 中 的 /*...*/ 注释 。 这 样 可 以 避免 在 文件 
的 开始 有 一 大 块 说 明文 本 时 每 一 行 都 有 //。 在 注释 内 部 ，// 和 /* 没有 特殊 的 含义 ， 所 以 注 
释 不 能 相 套 。 
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The Go Programming Language 


程序 结构 


与 其 他 编程 语言 一 样 ，Go 语言 中 的 大 程序 都 从 小 的 基本 组 件 构建 而 来 : 变量 存储 值 ; 
简单 表达 式 通 过 加 和 减 等 操作 合并 成 大 的 ; 基本 类 型 通过 数组 和 结构 体 进 行 聚合 ; 表达 式 通 
过 if 和 for 等 控制 语句 来 决定 执行 顺序 ; 语句 被 组 织 成 函数 用 于 隔离 和 复 用 ; 函数 被 组 织 
成 源 文件 和 包 。 

上 面 这 些 内 容 中 的 大 部 分 已 在 前 一 章 介绍 过 ， 本 章 将 更 细致 地 讨论 Go 程序 中 的 基本 
结构 元 素 。 示 例 程序 有 意 进 行 了 简化 ， 这 有 助 于 聚焦 于 语言 本 身 而 不 是 复杂 的 算法 和 数据 
结构 。 


.2.1 名 称 


Go 中 函数 、 变 量 、 和 常量、 类 型 、 语 句 标签 和 包 的 名 称 遵循 一 个 简单 的 规则 : 名称 的 开 
头 是 一 个 字母 《Unicode 中 的 字符 即 可 ) 或 下 划 线 ， 后 面 可 以 跟 任意 数量 的 字符 、 数 字 和 下 
划 线 ， 并 区 分 大 小 写 。 如 heapsort 和 Heapsort 是 不 同 的 名 称 。 

Go 有 25 个 像 if 和 switch 这 样 的 关键 字 ， 只 能 用 在 语法 允许 的 地 方 ， 它 们 不 能 作为 
名 称 : 


break default func interface select 
case ; defer go map struct 
chan else goto package switch 
const ， fallthrough if range type 
continue for import return var 


另外 ， 还 有 三 十 几 个 内 置 的 预 声明 的 常量 、 类 型 和 函数 : 


常量 : true false iota nil 

类 型 : int int8 int16 int32 int64 
uint uint8 uint16 uint32 uint64 uintptr 
float32 float64 complex128 complex64 
bool byte rune string error 

函数 : make len cap new append copy close delete 
complex real imag 
panic recover 


这 些 名 称 不 是 预 留 的 ， 可 以 在 声明 中 使 用 它们 。 我 们 将 在 很 多 地 方 看 到 对 其 中 的 名 称 进 
行 重 声明 ， 但 是 要 知道 这 有 冲突 的 风险 。 

如 果 一 个 实体 在 函数 中 声明 ， 它 只 在 函数 局 部 有 效 。 如 果 声 明 在 函数 外 ， 它 将 对 包 里 面 
的 所 有 源 文件 可 见 。 实 体 第 一 个 字母 的 大 小 写 决定 其 可 见 性 是 否 跨 包 。 如 果 名 称 以 大 写字 母 
的 开头 ， 它 是 导出 的 ， 意 味 着 它 对 包 外 是 可 见 和 可 访问 的 ， 可 以 被 自己 包 之 外 的 其 他 程序 所 
引用 , 像 fmt 包 中 的 Printf。 包 名 本 身 总 是 由 小 写字 母 组 成 。 

名 称 本 身 没 有 长 度 限 制 ， 但 是 习惯 以 及 Go 的 编程 风格 倾向 于 使 用 短 名 称 ， 特 别 是 作用 
域 较 小 的 局 部 变量 ， 你 更 喜欢 看 到 一 个 变量 叫 i 而 不 是 theLoopIndex。 通 常 ， 名 称 的 作用 域 
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越 大 ， 就 使 用 越 长 且 更 有 意义 的 名 称 。 

风格 上 ， 当 遇 到 由 单词 组 合 的 名 称 时 ，Go 程序 员 使 用 “驼峰 式 ” 的 风格 一 一 更 喜欢 使 
用 大 写字 母 而 不 是 下 划 线 。 所 以 标准 库 中 的 函数 名 采用 QuoteRuneToAscII 和 parseRequestLine 
的 形式 ， 而 不 会 采用 quote_rune_to_AscII 或 quote_rune_to_AscII 这 样 的 形式 。 像 ASCII 和 
HTML 这 样 的 首 字母 缩写 词 通常 使 用 相同 的 大 小 写 ， 所 以 一 个 函数 可 以 叫 作 htmlEscape、 


HTMLEscape 或 escapeHTML ， 介 不 会 是 escapeHtml。 


2.2 声明 


声明 给 一 个 程序 实体 命名 ， 并 且 设 定 其 部 分 或 全 部 属性 。 有 4 个 主要 的 声明 : 变量 
(var)、 和 常量 (const)、 类 型 ( type) 和 函数 ( func)。 本 章 讨论 变量 和 类 型 ， 常 量 放 在 第 3 章 
讨论 ， 函 数 放 在 第 5 章 讨论 。 

Go 程序 存储 在 一 个 或 多 个 以 .go 为 后 级 的 文件 里 。 每 一 个 文件 以 package 声明 开头 ， 表 
明文 件 属于 哪个 包 。package 声明 后 面 是 import 声明 ， 然 后 是 包 级 别 的 类 型 、 变 量 、 常 量 、 
函数 的 声明 ， 不 区 分 顺序 。 例 如 ， 下 面 的 程序 声明 一 个 常量 、 一 个 函数 和 一 对 变量 : 

Bopl1.io/ch2/boiling 


// boiling 输出 水 的 沸点 
package main 


import "fmt" 
const boilingF = 212.6 


func main() { 
var f = boilingF 
varc=(f - 32)*5/9 
fmt.Printf("boiling point = %g°F or %g°C\n", f, c) 
// 输出 : 
// boiling point = 212°F or 166?C 

} 

常量 boilingF 是 一 个 包 级 别 的 声明 (main 包 )，f 和 是 属于 main 函数 的 局 部 变量 。 包 
级 别 的 实体 名 字 不 仅 对 于 包含 其 声明 的 源 文件 可 见 ， 而 且 对 于 同一 个 包 里 面 的 所 有 源 文件 都 
可 匈 。 男 一 方面 ， 局 部 声明 仅仅 是 在 声明 所 在 的 函数 内 部 可 见 ， 并 且 可 能 对 于 函数 中 的 一 小 
块 区 域 可 见 。 

困 数 的 声明 包含 一 个 名 字 、 一 个 参数 列表 (由 函数 的 调用 者 提供 的 变量 )、 一 个 可 选 的 
返回 值 列表 ， 以 及 函数 体 (其 中 包含 具体 逻辑 语句 )。 如 果 函 数 不 返 回 任何 内 容 ， 返 回 值 列 
表 可 以 省 略 。 函 数 的 执行 从 第 一 个 语句 开始 ， 直 到 遇 到 一 个 返回 语句 ， 或 者 执行 到 无 返回 结 
果 的 函数 的 结尾 。 然 后 程序 控制 和 返回 值 (如 果 有 的 话 ) 都 返回 给 调用 者 。 

我 们 已 经 看 过 许多 函数 ， 将 来 还 会 遇见 更 多 ,在 第 5 章 有 更 广泛 的 讨论 ， 因 此 这 里 仅仅 
是 一 个 概括 。 下 面 的 函数 froc 封装 了 温度 转换 的 逻辑 ， 这 样 它 可 以 只 定义 一 次 而 在 多 个 地 
方 使 用 。 这 里 main 调用 了 它 两 次 ， 使 用 两 个 不 同 的 局 部 常量 的 值 : 

gopl1.io/ch2/ftoc 
// ftoc 输出 两 个 华氏 温度 - 摄氏 温度 的 转换 


package main 


import "fmt" 
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func main() { 
const freezingF, boilingF = 32.6，212.6 
fmt.Printf("%g°F = %g°C\n", freezingF, fToC(freezingF)) // "32°F = 8°C" 
fmt.Printf("%g°F = %g°C\n", boilingF, fToC(boilingF)) // "212°F = 166?C"” 
} 


func fToC(f float64) float64 { 
return (f - 32) * 5 / 9 


2.3 变量 


var 声明 创建 一 个 具体 类 型 的 变量 ， 然 后 给 它 附加 一 个 名 字 ， 设 置 它 的 初始 值 。 每 一 个 
声明 有 一 个 通用 的 形式 : 
var name type = expression 


类 型 和 表达 式 部 分 可 以 省 略 一 个 ， 但 是 不 能 都 省 略 。 如 果 类 型 省 略 ， 它 的 类 型 将 由 初始 
化 表达 式 决定 ;如 果 表 达 式 省 略 ， 其 初始 值 对 应 于 类 型 的 零 值 一 一 对 于 数字 是 e， 对 于 布尔 
值 是 false， 对 于 字符 串 是 ""， 对 于 接口 和 引用 类 型 ( slice 、 指 针 、map、 通 道 、 函 数 ) 是 
nil。 对 于 一 个 像 数组 或 结构 体 这 样 的 复合 类 型 ， 零 值 是 其 所 有 元 素 或 成 员 的 零 值 。 

零 值 机 制 保障 所 有 的 变量 是 良好 定义 的 ，Go 里 面 不 存在 未 初始 化 变量 。 这 种 机 制 简化 
了 代码 ， 并 且 不 需要 额外 工作 就 能 感知 边界 条 件 的 行为 。 例 如 : 


var s string 
Fmt PRinElmGs) A 


输出 空 字符 串 ， 而 不 是 一 些 错误 或 不 可 预料 的 行为 。Go 程序 员 经 常 花费 精力 来 使 复杂 类 型 
的 零 值 有 意义 ， 以 便 变 量 一 开始 就 处 于 一 个 可 用 状态 。 

可 以 声明 一 个 变量 列表 ， 并 选择 使 用 对 应 的 表达 式 列表 对 其 初始 化 。 忽 略 类 型 允许 声明 
多 个 不 同类 型 的 变量 。 


var i, j, k int 7 nt: nt, int 
var b, f, s = true, 2.3, "four" // bool, float64, string 


初始 值 设 定 可 以 是 字面 量 值 或 者 任意 的 表达 式 。 包 级 别 的 初始 化 在 main 开始 之 前 进行 
(参考 2.6.2 节 )， 局 部 变量 初始 化 和 声明 一 样 在 函数 执行 期 间 进行 。 
变量 可 以 通过 调用 返回 多 个 值 的 函数 进行 初始 化 : 


var f，err = 0s.0pen(name) // os.0pen 返回 一 个 文件 和 一 个 错误 


2.3.1 短 变量 声明 


在 函数 中 ， 一 种 称 作 短 变量 声明 的 可 选 形式 可 以 用 来 声明 和 初始 化 局 部 变量 。 它 使 用 
name:= expression 的 形式 ，name 的 类 型 由 expression 的 类 型 决定 。 这 里 是 lissajous 函数 ( 参 
考 1.4 节 ) 中 的 三 个 短 变量 声明 : 


anim := gif.GIF{LoopCount: nframes} 
freq := rand.Float64() * 3.6 
t := 0.6 


因 其 短小 、 灵 活 ， 故 而 在 局 部 变量 的 声明 和 初始 化 中 主要 使 用 短 声 明 。var 声明 通常 是 
为 那些 跟 初 始 化 表达 式 类 型 不 一 致 的 局 部 变量 保留 的 ， 或 者 用 于 后 面 才 对 变量 赋值 以 及 变量 
初始 值 不 重要 的 情况 。 
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i := 166 // 一 个 int 类 型 的 变量 
var boiling float64 = 166 // 一 个 float64 类 型 的 变量 


var names []string 
var err error 
var p Point 


与 var 声明 一 样 ， 多 个 变量 可 以 以 短 变量 声明 的 方式 声明 和 初始 化 : 


0 和 


只 有 当 它 们 对 于 可 读 性 有 帮助 的 时 候 才 使 用 多 个 初始 化 表达 式 来 进行 变量 声明 ， 例 如 短 
小 且 天 然 一 组 的 for 循环 的 初始 化 。 

记 住 ，:= 表示 声明 ， 而 = 表示 赋值 。 一 个 多 变量 的 声明 不 能 和 多 重 赋值 (参考 2.4.1 节 ) 
搞 混 ， 后 者 将 右边 的 值 赋 给 左边 的 对 应 变量 : 

i, j = j,i // 交换 i 和 j 的 值 

与 普通 的 var 声明 类 似 ， 短 变量 声明 也 可 以 用 来 调用 像 os .open 那样 返回 两 个 或 多 个 值 
的 函数 : 


f, err := 0s.0pen(name) 
if err != nil { 
return err 


} 
i 
f.Close() 


一 个 容易 被 忽略 但 重要 的 地 方 是 : 短 变量 声明 不 需要 声明 所 有 在 左边 的 变量 。 如 果 一 些 
变量 在 同一 个 词法 块 中 声明 (参考 2.7 节 )， 那 么 对 于 那些 变量 ， 短 声明 的 行为 等 同 于 赋值 。 

在 如 下 代码 中 ， 第 一 条 语句 声明 了 in 和 err。 第 二 条 语句 仅 声明 了 out， 但 向 已 有 的 
err 变量 赋 了 值 。 


in, err := 0S.0pen(infile) 
HL mes 
out, err := 0s.Create(outfile) 


短 变量 声明 最 少 声明 一 个 新 变量 ， 否 则 ， 代 码 编译 将 无 法 通过 : 
f, err := 0s.0pen(infile) 


Mis 
f，err := os.Create(outfile) // 编译 错误 : 没有 新 的 变量 


第 二 个 语句 使 用 普通 的 赋值 语句 来 修复 这 个 错误 。 
只 有 在 同一 个 词法 块 中 已 经 存在 变量 的 情况 下 ， 短 声明 的 行为 才 和 赋值 操作 一 样 ， 外 层 
的 声明 将 被 忽略 。 我 们 在 本 章 结尾 的 例子 中 将 看 到 。 


2.3.2 ”指针 


变量 是 存储 值 的 地 方 。 借 助 声 明 创建 的 变量 使 用 名 字 来 区 分 例如 x， 但 是 许多 变量 仅 
仅 使 用 像 x[i] 或 者 x.f 这 样 的 表达 式 来 区 分 。 所 有 这 些 表达 式 读 取 一 个 变量 的 值 ， 除 非 它们 
出 现在 赋值 操作 符 的 左边 ， 这 个 时 候 是 给 变量 赋值 。 

指针 的 值 是 一 个 变量 的 地 址 。 一 个 指针 指示 值 所 保存 的 位 置 。 不 是 所 有 的 值 都 有 地 址 ， 
但 是 所 有 的 变量 都 有 。 使 用 指针 ， 可 以 在 无 须知 道 变量 名 字 的 情况 下 ， 间 接 读 取 或 更 新 变量 
的 值 。 
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如 果 一 个 变量 声明 为 var x int， 表达 式 &x (x 的 地 址 ) 获取 一 个 指向 整 型 变量 的 指针 ， 
它 的 类 型 是 整 型 指针 (*int)。 如 果 值 叫 作 p， 我 们 说 p 指向 x, 或 者 p 包含 x 的 地 址 。p 指向 
的 变量 写成 *p。 表 达 式 *p 获取 变量 的 值 ， 一 个 整 型 ， 因 为 *p 代表 一 个 变量 ， 所 以 它 也 可 以 
出 现在 赋值 操作 符 左边 ， 用 于 更 新 变量 的 值 。 


x:=1 
p := &x // p 是 整 型 指针 ， 指 向 x 
fmt.Println(*p) // "1" 


*p = 2 太 等 于 天 二 马 

fmt.Println(x) // 结果 "2" 

每 一 个 聚合 类 型 变量 的 组 成 (结构 体 的 成 员 或 数组 中 的 元 素 ) 都 是 变量 ， 所 以 也 有 一 个 
地 址 。 

变量 有 时 候 使 用 一 个 地 址 化 的 值 。 代 表 变 量 的 表达 式 ， 是 唯一 可 以 应 用 取 地 址 操作 符 & 
的 表达 式 。 

指针 类 型 的 零 值 是 nil。 测 试 p!= nil， 结 果 是 true 说 明 p 指向 一 个 变量 。 指 针 是 可 比较 
的 ， 两 个 指针 当 且 仅 当 指向 同一 个 变量 或 者 两 者 都 是 nil 的 情况 下 才 相 等 。 


Var XX, YY int 
fmt.Println(&x == &x，&x == &y，&x == nil) // "true false false" 


消 数 返回 局 部 变量 的 地 址 是 非常 安全 的 。 例 如 下 面 的 代码 中 ， 通 过 调用 f 产生 的 局 部 变 
量 v 即使 在 调用 返回 后 依然 存在 ， 指 针 p 依然 引用 它 : 
var p= f() 


func f() *int { 
VW ;于 
return &v 


} 

每 次 调用 f 都 会 返回 一 个 不 同 的 值 : 

fmt.Println(f() == f()) // "false" 

因为 一 个 指针 包含 变量 的 地 址 ， 所 以 传递 一 个 指针 参数 给 函数 ， 能 够 让 函数 更 新 间接 传 
递 的 变量 值 。 例 如 ， 这 个 函数 递增 一 个 指针 参数 所 指向 的 变量 ， 然 后 返回 此 变量 的 新 值 ， 于 
是 它 可 以 在 表达 式 中 使 用 : 


func incr(p *int) int { 


*p++ // 递增 p 所 指向 的 值 ; p 自身 保持 不 变 


return *p 
v:=1 
incr(&v) // 副作用 : v 现在 等 于 2 


fmt.Println(incr(&v)) // "3"”(v 现在 是 3) 

每 次 使 用 变量 的 地 址 或 者 复制 一 个 指针 ， 我 们 就 创建 了 新 的 别名 或 者 方式 来 标记 同一 变 
量 。 例 如 ，*p 是 v 的 别名 。 指 针 别 名 人 允许 我 们 不 用 变量 的 名 字 来 访问 变量 ， 这 一 点 是 非常 有 
用 的 ， 但 是 它 是 双 刃 剑 : 为 了 找到 所 有 访问 变量 的 语句 ， 需 要 知道 所 有 的 别名 。 不 仅 指针 产 
生 别 名 ， 当 复制 其 他 引用 类 型 ( 像 slice、map、 通 道 ， 甚 至 包含 这 里 引用 类 型 的 结构 体 、 数 
组 和 接口 ) 的 值 的 时 候 ， 也 会 产生 别名 。 

指针 对 于 flag 包 是 很 关键 的 ， 它 使 用 程序 的 命令 行 参数 来 设置 整个 程序 内 某 些 变量 的 
值 。 为 了 说 明 ， 下 面 这 个 变种 的 echo 命令 使 用 两 个 可 选 的 标识 参数 : -n 使 echo 忽略 正常 输 
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出 时 结尾 的 换行 符 ，-s sep 使 用 sep 替换 默认 参数 输出 时 使 用 的 空格 分 隔 符 。 因 为 这 是 第 4 


版 ， 所 以 包 名 字 叫 作 gop1.io/ch2/echo4。 
gop1.io/ch2/echo4 
// echo4 输出 其 命令 行 参数 


package main 


import ( 
"flag" 
"fmt" 
"strings" 
) 
var n = flag.Bool("n", false, "omit trailing newline") 
var sep = flag.String("s", " ", "separator") 


func main() { 
flag.Parse() 
fmt.Print(strings.Join(flag.Args(), *sep)) 
if J*n 
fmt.Println() 


} 


flag.Bool 函数 创建 一 个 新 的 布尔 标识 变量 。 它 有 三 个 参数 : 标识 的 名 字 ( "n")， 变 量 的 
默认 值 (false)， 以 及 当 用 户 提供 非法 标识 、 非 法 参数 抑或 -h 或 -help 参数 时 输出 的 消息 。 
同样 地 ，flag.string 也 使 用 名 字 、 默 认 值 和 消息 来 创建 一 个 字符 串 变量 。 变 量 sep 和 nm 是 指 


向 标识 变量 的 指针 ， 它 们 必须 通过 *sep 和 *n 来 访问 。 


当 程 序 运行 时 ， 在 使 用 标识 前 ， 必 须 调 用 flag.Parse 来 更 新 标识 变量 的 默认 值 。 非 标识 
参数 也 可 以 从 flag.Args() 返回 的 字符 串 slice 来 访问 。 如 果 flag.Parse 遇 到 错误 ， 它 输出 一 


条 帮助 消息 ， 然 后 调用 os.Exit(2) 来 结束 程序 。 
让 我 们 运行 一 些 echo 测试 用 例 : 


$ go build gopl.io/ch2/echo4 
$ ./echo4 a bc def 
a bc def 
$ ./echo4 -s / a bc def 
a/bc/def 
$ ./echo4 -n a bc def 
a bc def$ 
$ ./echo4 -help 
Usage of ./echo4: 
-nN omit trailing newline 
-Ss string 
separator (default " ") 


2.3.3 ”new 函数 


另外 一 种 创建 变量 的 方式 是 使 用 内 置 的 new 函数 。 表 达 式 new(T) 创建 一 个 未 命名 的 T 类 


型 变量 ,初始 化 为 7 类 型 的 零 值 ， 并 返回 其 地 址 (地址 类 型 为 *T)。 


p := new(int)  // *int 类 型 的 p, 指向 未 命名 的 int 变量 
fmt.Println(*p) // 输出 "@" 

站 站 = // 把 未 命名 的 int 设置 为 2 
fmt.Println(*p) // 输出 "2" 


使 用 new 创建 的 变量 和 取 其 地 址 的 普通 局 部 变量 没有 什么 不 同 ， 只 是 不 需要 引入 (和 声 
明 ) 一 个 虚拟 的 名 字 ， 通 过 new(T) 就 可 以 直接 在 表达 式 中 使 用 。 因 此 new 只 是 语法 上 的 便 
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利 ， 不 是 一 个 基础 概念 。 
下 面 两 个 newInt 函数 有 同样 的 行为 。 


func newInt() *int { func newInt() *int { 
return new(int) var dummy int 
return &dummy 
} 
每 一 次 调用 new 返回 一 个 具有 了 唯一 地 址 的 不 同 变 量 : 
:= new(int) 
q := new(int) 


fmt.Println(p == q) // "false" 


这 个 规则 有 一 个 例外 : 两 个 变量 的 类 型 不 携带 任何 信息 且 是 零 值 ， 例 如 struct{} 或 [6] 
当前 的 实现 里 面 ， 它 们 有 相同 的 地 址 。 
因为 最 常见 的 未 命名 变量 都 是 结构 体 类 型 ， 它 的 语法 (参考 4.4.1 节 ) 比较 复杂 ， 所 以 
new 函数 使 用 得 相对 较 少 。 

new 是 一 个 预 声 明 的 函数 ， 不 是 一 个 关键 字 ， 所 以 它 可 以 重 定义 为 男 外 的 其 他 类 型 ， 
例如 : 


func delta(old, new int) int { return new - old } 


自然 ， 在 delta 函数 内 ， 内 置 的 new 函数 是 不 可 用 的 。 


2.3.4 变量 的 生命 周期 


生命 周期 指 在 程序 执行 过 程 中 变量 存在 的 时 间 段 。 包 级 别 变量 的 生命 周期 是 整个 程序 的 
执行 时 间 。 相 反 ， 局 部 变量 有 一 个 动态 的 生命 周期 : 每 次 执行 声明 语句 时 创建 一 个 新 的 实 
体 ， 变 量 一 直 生存 到 它 变 得 不 可 访问 ， 这 时 它 占 用 的 存储 空间 被 回收 。 函 数 的 参数 和 返回 值 
也 是 局 部 变量 ,它们 在 其 闭 包 函 数 被 调用 的 时 候 创建 。 

例如 ， 在 1.4 节 中 的 lissajous 示例 程序 中 : 

fort := 6.6; t < cycles*2*math.Pi; t += res { 

x := math.Sin(t) 
y := math.Sin(t*freq + phase) 


img.SetColorIndex(size+int(x*size+0.5), size+int(y*size+0.5), 
blackIndex) 


+ 


int; 


} 


变量 t 在 每 次 for 循环 的 开始 创建 ， 变 量 x 和 y 在 循环 的 每 次 迭代 中 创建 。 

那么 垃圾 回收 器 如 何 知 道 一 个 变量 是 否 应 该 被 回收 ? 说 来 话 长 ， 基 本 思路 是 每 一 个 包 级 
别 的 变量 ， 以 及 每 一 个 当前 执行 函数 的 局 部 变量 ， 可 以 作为 追溯 该 变量 的 路 径 的 源头 ， 通 过 
指针 和 其 他 方式 的 引用 可 以 找到 变量 。 如 果 变 量 的 路 径 不 存在 ， 那 么 变量 变 得 不 可 访问 ， 因 
此 它 不 会 影响 任何 其 他 的 计算 过 程 。 

因为 变量 的 生命 周期 是 通过 它 是 否 可 达 来 确定 的 ， 所 以 局 部 变量 可 在 包含 它 的 循环 的 一 
次 迭代 之 外 继续 存活 。 即 使 包含 它 的 循环 已 经 返回 ， 它 的 存在 还 可 能 延续 。 

编译 右 可 以 选择 使 用 堆 或 栈 上 的 空间 来 分 配 ， 令 人 惊奇 的 是 ， 这 个 选择 不 是 基于 使 用 
var 或 new 关键 字 来 声明 变量 。 
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var global *int 


func f() { func g() { 
var x int y := new(int) 
沪 泽 入 *y=1 
global = &x } 

} 


这 里 ，x 一 定 使 用 堆 空 间 ， 因 为 它 在 f 了 消 数 返回 以 后 还 可 以 从 global 变量 访问 ， 尽 管 它 
被 声明 为 一 个 局 部 变量 。 这 种 情况 我 们 说 x 从 f 中 光 选 。 相 反 ， 当 g 函数 返回 时 ， 变 量 *y 变 
得 不 可 访问 ， 可 回收 。 因 为 *y 没有 从 g 中 逃逸 ， 所 以 编译 器 可 以 安全 地 在 栈 上 分 配 *y， 即 便 
使 用 new 函数 创建 它 。 任 何 情况 下 ， 逃 逸 的 概念 使 你 不 需要 额外 费心 来 写 正 确 的 代码 ， 但 要 
记 住 它 在 性 能 优化 的 时 候 是 有 好 处 的 ， 因 为 每 一 次 变量 逃逸 都 需要 一 次 额外 的 内 存 分 配 过 程 。 

垃圾 回收 对 于 写 出 正确 的 程序 有 巨大 的 帮助 ， 但 是 免不了 考虑 内 存 的 负担 。 不 需要 显 式 
分 配 和 释放 内 存 ， 但 是 变量 的 生命 周期 是 写 出 高 效 程序 所 必需 清楚 的 。 例 如 ， 在 长 生命 周期 
对 象 中 保持 短 生命 周期 对 象 不 必要 的 指针 ， 特 别 是 在 全 局 变量 中 ,会 阻止 垃圾 回收 器 回收 短 
生命 周期 的 对 象 空间 。 


2.4 赋值 

赋值 语句 用 来 更 新 变量 所 指 的 值 ， 它 最 简单 的 形式 由 赋值 符 =， 以 及 符号 左边 的 变量 和 
右边 的 表达 式 组 成 。 

x = 1 // 有 名 称 的 变量 

*p = true // 间接 变量 

person.name = "bob" // 结构 体 成 员 


count[x] = count[x] * scale // 数组 或 slice 或 map 的 元 素 


每 一 个 算术 和 二 进 制 位 操作 符 有 一 个 对 应 的 赋值 操作 符 ， 例如， 最 后 的 那个 语句 可 以 重 


count[x] *= scale 


它 避 免 了 在 表达 式 中 重复 变量 本 身 。 
数字 变量 也 可 以 通过 ++ 和 -- 语句 进行 递增 和 递减 : 


V := 1 

V++ // 等 同 于 vV = vt+1;Vv 变 成 2 

Vi // 等 同 于 vV = v -1iv 变 成 1 
2.4.1 多重 赋值 


另 一 种 形式 的 赋值 是 多 重 赋值 ， 它 允许 几 个 变量 一 次 性 被 赋值 。 在 实际 更 新 变量 前 ， 右 
边 所 有 的 表达 式 被 推演 ， 当 变量 同时 出 现在 赋值 符 两 侧 的 时 候 这 种 形式 特别 有 用 ， 例 如 ， 当 
交换 两 个 变量 的 值 时 : 


X，y = y, x 
a[i], a[j] = a[j], a[i] 
或 者 计算 两 个 整数 的 最 大 公约 数 : 
func gcd(x, y int) int { 
fory !=@f{ 
x, y = y, x%y 
return x 


} 
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或 者 计算 斐 波 那 契 数列 的 第 n 个 数 : 
func fib(n int) int { 
并 
fori:=6ji<ni it++{ 
xX, Yy = yY，X+y 
return x 


} 
多 重 赋值 也 可 以 使 一 个 普通 的 赋值 序列 变 得 紧凑 : 
1, J kK= 2; 3, 5 


从 风格 上 考虑 ， 如 果 表 达 式 比较 复杂 ， 则 避免 使 用 多 重 赋值 形式 ; 一 系列 独立 的 语句 更 
易 读 。 

这 类 表达 式 〈 例 如 一 个 有 多 个 返回 值 的 函数 调用 ) 产生 多 个 值 。 当 在 一 个 赋值 语句 中 使 
用 这 样 的 调用 时 ， 左 边 的 变量 个 数 需 要 和 函数 的 返回 值 一 样 多 。 

f，err = os.0pen("foo.txt") // 函数 调用 返回 两 个 值 


通常 函数 使 用 额外 的 返回 值 来 指示 一 些 错误 情况 ， 例 如 通过 os.open 返回 的 error 类 型 ， 
或 者 一 个 通常 叫 ok 的 bool 类 型 变量 。 我 们 会 在 后 面 的 章节 中 看 到 ， 这 里 有 三 个 操作 符 也 有 
类 似 的 行为 。 如 果 map 查询 (参考 4.3 节 )、 nr ed eer 
考 8.4.2 节 ) 出 现在 两 个 结果 的 赋值 语句 中 ， 都 会 产生 一 个 额外 的 布尔 型 


v，ok = m[key] // map 查询 
v，ok = x.(T) // 类 型 断言 
v, ok = <-ch // 通道 接收 


像 变 量 声 明 一 样 ， 可 以 将 不 需要 的 值 赋 给 空 标识 符 : 


_，err = io.Copy(dst，src) // 丢弃 字 节 个 数 
_，ok = x.(T) // 检查 类 型 但 丢弃 结果 


2.4.2 ”可 赋值 性 


赋值 语句 是 显 式 形式 的 赋值 ， 但 是 程序 中 很 多 地 方 的 赋值 是 隐 式 的 : 一 个 函数 调用 隐 式 
地 将 参数 的 值 赋 给 对 应 参数 的 变量 ; 一 个 return 语句 隐 式 地 将 return 操作 数 赋值 给 结果 变 
量 。 复 合 类 型 的 字面 量 表达 式 ， 例 如 slice (参考 4.2 节 ): 


medals := []string{"gold", "silver", "bronze"} 


隐 式 地 给 每 一 个 元 素 赋值 ， 它 可 以 写成 下 面 这 样 : 


medals[6] = "gold" 
medals[1] = "silver" 
medals[2] = "bronze" 


map 和 通道 的 元 素 尽管 不 是 普通 变量 ,但 它们 也 遵循 相似 的 隐 式 赋值 。 

不 管 隐 式 还 是 显 式 赋值 ， 如 果 左 边 的 (变量 ) 和 右边 的 ( 值 ) 类 型 相同 ， 它 就 是 合法 的 。 
通俗 地 说 ， 赋 值 只 有 在 值 对 于 变量 类 型 是 可 赋值 的 时 才 合 法 。 

可 赋值 性 根据 类 型 不 同 有 着 不 同 的 规则 ， 我 们 将 会 在 引入 新 类 型 的 时 候 解释 相应 的 规 
则 。 对 已 经 讨论 过 的 类 型 ， 规 则 很 简单 : 类 型 必须 精准 匹配 ，nil 可 以 被 赋 给 任何 接口 变量 
或 引用 类 型 。 常 量 (参考 3.6 节 ) 有 更 灵活 的 可 赋值 性 规则 来 规避 显 式 的 转换 。 
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两 个 值 使 用 == 和 != 进行 比较 与 可 赋值 性 相关 : 任何 比较 中 ， 第 一 个 操作 数 相 对 于 第 二 
个 操作 数 的 类 型 必须 是 可 赋值 的 ， 或 者 可 以 反 过 来 赋值 。 与 可 赋值 性 一 样 ， 我 们 也 将 解释 新 
类 型 的 可 比较 性 的 相关 规则 。 


2.5 ”类 型 声明 

变量 或 表达 式 的 类 型 定义 这 些 值 应 有 的 特性 ， 例 如 大 小 (多少 位 或 多 少 个 元 素 等 )、 在 
内 部 如 何 表达 、 可 以 对 其 进行 何 种 操作 以 及 它们 所 关联 的 方法 。 

任何 程序 中 ， 都 有 一 些 变量 使 用 相同 的 表示 方式 ， 但 是 含义 相差 非常 大 。 例 如 ，int 类 
型 可 以 用 于 表示 循环 的 索引 、 时 间 惟 、 文 件 描述 符 或 月 份 ; float64 类 型 可 以 表示 每 秒 多 少 
米 的 速度 或 精确 到 几 位 小 数 的 温度 ; string 类 型 可 以 表示 密码 或 者 颜色 的 名 字 。 

type 声明 定义 一 个 新 的 命名 类 型 ， 它 和 某 个 已 有 类 型 使 用 同样 的 底层 类 型 。 命 名 类 型 提 
供 了 一 种 方式 来 区 分 底层 类 型 的 不 同 或 者 不 兼容 使 用 ， 这 样 它们 就 不 会 在 无 意 中 混 用 。 


type name underlying-type 


类 型 的 声明 通常 出 现在 包 级 别 ， 这 里 命名 的 类 型 在 整个 包 中 可 见 ， 如 果 名 字 是 导出 的 
(开头 使 用 大 写字 母 )， 其 他 的 包 也 可 以 访问 它 。 

为 了 说 明 类 型 声明 ， 我 们 把 不 同 计量 单位 的 温度 值 转换 为 不 同 的 类 型 : 
gopl1.io/ch2/tempconve 


// 包 tempconv 进行 摄氏 温度 和 华氏 温度 的 转换 计算 


package tempconv 





import "fmt" 


type Celsius float64 
type Fahrenheit float64 


const ( 
AbsoluteZeroC Celsius = -273.15 
FreezingC Celsius = 6 
BoilingC Celsius = 166 


) 
func CToF(c Celsius) Fahrenheit { return Fahrenheit(c*9/5 + 32) } 
func FToC(f Fahrenheit) Celsius { return Celsius((f - 32) * 5 / 9) } 


这 个 包 定 义 了 两 个 类 型 一 一 celsius (摄氏 温度 ) 和 Fahrenheit (华氏 温度 )， 它 们 分 别 对 
应 两 种 温度 计量 单位 。 即 使 使 用 相同 的 底层 类 型 float64， 它 们 也 不 是 相同 的 类 型 ， 所 以 它 
们 不 能 使 用 算术 表达 式 进行 比较 和 合并 。 区 分 这 些 类 型 可 以 防止 无 意 间 合并 不 同 计量 单位 
的 温度 值 ， 从 float64 转换 为 celsius(t) 或 Fahrenheit(t) 需要 显 式 类 型 转换 。Ccelsius(t) 和 
Fahrenheit(t) 是 类 型 转换 ， 而 不 是 函数 调用 。 它 们 不 会 改变 值 和 表达 方式 ， 但 改变 了 显 式 意 
义 。 另 一 方面 ， 函 数 cToF 和 FToc 用 来 在 两 种 温度 计量 单位 之 间 转 换 ， 返 回 不 同 的 数值 。 

对 于 每 个 类 型 T， 都 有 一 个 对 应 的 类 型 转换 操作 T(x) 将 值 x 转换 为 类 型 T。 如 果 两 个 类 
型 具有 相同 的 底层 类 型 或 二 者 都 是 指向 相同 底层 类 型 变量 的 未 命名 指针 类 型 ， 则 二 者 是 可 以 
相互 转换 的 。 类 型 转换 不 改变 类 型 值 的 表达 方式 ， 仅 改变 类 型 。 如 果 x 对 于 类 型 T 是 可 赋值 
的 ， 类 型 转换 也 是 允许 的 ， 但 是 通常 是 不 必要 的 。 

数字 类 型 间 的 转换 ， 字 符 串 和 一 些 slice 类 型 间 的 转换 是 允许 的 ， 我 们 将 在 下 一 章 详细 讨 
论 。 这 些 转换 会 改变 值 的 表达 方式 。 例 如 ， 从 浮 点 型 转化 为 整 型 会 丢失 小 数 部 分 ， 从 字符 串 
转换 成 字 节 ([]byte) slice 会 分 配 一 份 字符 串 数 据 副本 。 任 何 情况 下 ， 运 行 时 的 转换 不 会 失败 。 


30 及 2 草 


命名 类 型 的 底层 类 型 决定 了 它 的 结构 和 表达 方式 ， 以 及 它 支 持 的 内 部 操作 集合 ， 这 
些 内 部 操作 与 直接 使 用 底层 类 型 的 情况 相同 。 正 如 你 所 预期 的 ， 它 意味 着 对 于 celsius 和 
Fahrenheit 类 型 可 以 使 用 与 float64 相同 的 算术 操作 符 。 


fmt.Printf("%g\n", BoilingC-FreezingC) // "18686" °C 

boilingF := CToF(BoilingC) 

fmt.Printf("%g\n", boilingF-CToF(FreezingC)) // "186" °F 
fmt.Printf("%g\n", boilingF-FreezingC) // 编译 错误 : 类 型 不 匹配 


通过 == 和 < 之 类 的 比较 操作 符 ， 命 名 类 型 的 值 可 以 与 其 相同 类 型 的 值 或 者 底层 类 型 相 
同 的 未 命名 类 型 的 值 相 比较 。 但 是 不 同 命名 类 型 的 值 不 能 直接 比较 : 


var c Celsius 
var f Fahrenheit 


fmt.Println(c == 6) // "true”" 
fmt.Println(f >= 6) // "true" 
fmt.Println(c == f) // 编译 错误 : 类 型 不 匹配 


fmt.Println(c == Celsius(f)) // "true"! 


注意 最 后 一 种 情况 。 无 论 名 字 如 何 ， 类 型 转换 celsius(f) 没有 改变 参数 的 值 ， 只 改变 其 
类 型 。 测 试 结果 是 真 ， 因 为 c 和 ff 的 值 都 是 0。 

命名 类 型 提供 了 概念 上 的 便利 ， 避 免 一 遍 遍 地 重复 写 复 杂 的 类 型 。 当 底层 类 型 是 像 
float64 这 样 简单 的 类 型 时 ， 好 处 就 不 大 了 ， 但 是 对 于 我 们 将 讨论 到 的 复杂 结构 体 类 型 ， 好 
处 就 很 大 ， 在 讨论 结构 体 时 将 介绍 这 一 点 。 

下 面 的 声明 中 ，celsius 参数 < 出 现在 函数 名 字 前 面 ， 名 字 叫 string 的 方法 关联 到 
Celsius 类 型 ， 返回 c 变量 的 数字 值 ， 后 面 跟着 摄氏 温度 的 符号 %C。 


func (c Celsius) String() string { return fmt.Sprintf("%g°C", c) } 


很 多 类 型 都 声明 这 样 一 个 string 方法 ， 在 变量 通过 fmt 包 作 为 字符 串 输出 时 ， 它 可 以 控 
制 类 型 值 的 显示 方式 ， 我 们 将 在 7.1 节 中 看 到 。 


c := FToC(212.6) 

fmt.Println(c.String()) // "166°C" 
fmt.Printf("%v\n", c)  // "188°C"; 不 需要 显 式 调用 字符 串 
fmt.printf("%s\n’, :e) ”69oC" 

fmt.Println(c) // "188°C" 
fmt.Printf("%g\n"，c)  //“"18e"; 不 调用 字符 串 
fmt.Println(float64(c)) // "166"; 不 调用 字符 串 


2.6 包 和 文件 


在 Go 语言 中 包 的 作用 和 其 他 语言 中 的 库 或 模块 作用 类 似 ， 用 于 支持 模块 化 、 封 装 、 编 
译 隔离 和 重用 。 一 个 包 的 源 代码 保存 在 一 个 或 多 个 以 .go 结尾 的 文件 中 ， 它 所 在 目录 名 的 尾 
部 就 是 包 的 导 和 人 路径， 例如 ，gopl.io/chl/helloworld 包 的 文件 存储 在 目录 $GoPATH/src/gop1. 
io/ch1/helloworld 中 。 

每 一 个 包 给 它 的 声明 提供 独立 的 命名 空间 。 例 如 ， 在 image 包 中 ，Decode 标识 符 和 
unicode/utf16 包 中 的 标识 符 一 样 ， 但 是 关联 了 不 同 的 函数 。 为 了 从 包 外 部 引用 一 个 函数 ， 我 
们 必须 明确 修饰 标识 符 来 指明 所 指 的 是 image.Decode 或 utf16.Decode。 

包 让 我 们 可 以 通过 控制 变量 在 包 外 面 的 可 见 性 或 导出 情况 来 隐藏 信息 。 在 Go 里 ， 通 过 
一 条 简单 的 规则 来 管理 标识 符 是 否 对 外 可 见 : 导出 的 标识 符 以 大 写字 母 开头 。 

为 了 说 明基 本 原理 ， 假 设 温 度 转换 软件 很 受 欢 迎 ， 我 们 想 把 它 作 为 新 包 贡 献 给 Go 社 
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区 ， 将 要 怎么 做 呢 ? 

我 们 创建 一 个 叫 作 gopl.io/chz/tempconv 的 包 ， 这 是 前 面 例子 的 变种 (这 里 我 们 没有 照 惯 
例 对 例子 进行 顺序 编号 ， 目 的 是 让 包 路 径 更 实际 一 些 )。 包 自己 保存 在 两 个 文件 里 ， 以 展示 如 
何 访问 一 个 包 里 面 多 个 独立 文件 中 的 声明 。 现 实 中 ， 像 这 样 的 小 包 可 能 只 需要 一 个 文件 。 

将 类 型 、 它 们 的 常量 及 方法 的 声明 放 在 tempconv.go 中 : 


gopl.io/ch2/tempconv 
// tempconv 包 负 责 摄氏 温度 与 华氏 温度 的 转换 


package tempconv 





import "fmt" 


type Celsius float64 
type Fahrenheit float64 


const ( 
AbsoluteZeroC Celsius = -273.15 
FreezingC Celsius = 6 
BoilingC Celsius = 166 


) 


func (c Celsius) String() string { return fmt.Sprintf("%g°C", c) } 
func (f Fahrenheit) String() string { return fmt.Sprintf("%g°F", f) } 


将 转换 函数 放 在 conv.go 中 : 


package tempconv 


// CToF 把 摄氏 温度 转换 为 华氏 温度 
func CToF(c Celsius) Fahrenheit { return Fahrenheit(c*9/5 + 32) } 


// FToC 把 华氏 温度 转换 为 摄氏 温度 

func FToC(f Fahrenheit) Celsius { return Celsius((f - 32) * 5 / 9) } 

每 一 个 文件 的 开头 用 package 声 明定 义 包 的 名 称 。 当 导入 包 时 ， 它 的 成 员 通过 诸如 
tempconv.CToF 等 方式 被 引用 。 如 果 包 级 别 的 名 字 ( 像 类 型 和 常量 ) 在 包 的 一 个 文件 中 声 
明 ， 就 像 所 有 的 源 代码 在 同一 个 文件 中 一 样 ， 它 们 对 于 同一 个 包 中 的 其 他 文件 可 见 。 注 意 ， 
tempconv.go 导 和 人 fmt 包 ，, 但 是 conv.go 没有 ， 因 为 它 本 身 没 有 用 到 fmt 包 。 

因为 包 级别 的 常量 名 字 以 大 写字 和 母 开 头 ， 所 以 它们 也 可 以 使 用 修饰 过 的 名 称 (如 


tempconv.AbsolutezeroC) 来 访问 : 

fmt.Printf("Brrrr! %v\n", tempconv.AbsoluteZeroC) // "Brrrr! -273.15°C" 

为 了 在 某 个 包 里 将 摄氏 温度 转换 为 华氏 温度 ， 导 入 包 gop1.io/ch2/tempconv， 然后 编写 
下 面 的 代码 : 

fmt.Println(tempconv.CToF (tempconv.BoilingC)) // "212°F" 

package 声明 前 面 紧 挨 着 的 文档 注释 (参考 10.7.4 节 ) 对 整个 包 进 行 描述 。 习 惯 上 ， 应 
该 在 开头 用 一 句 话 对 包 进 行 总 结 性 的 描述 。 每 一 个 包 里 只 有 一 个 文件 应 该 包含 该 包 的 文档 注 
释 。 扩 展 的 文档 注释 通常 放 在 一 个 文件 中 ， 按 惯例 名 字 叫 作 doc.go。 


练习 2.1 : 添加 类 型 、 常 量 和 函数 到 tempconv 包 中 ， 处 理 以 开尔文 为 单位 (K) 的 温度 
值 ，OK=-273.15% ， 变 化 1K 和 变化 1% 是 等 价 的 。 


2.6.1 导入 
在 Go 程序 里 ， 每 一 个 包 通 过 称 为 导入 路 径 (import path) 的 唯一 字符 串 来 标识 。 它 们 
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出 现在 诸如 "gop1.io/ch2/tempconv" 之 类 的 import 声明 中 。 语 言 的 规范 没有 定义 哪些 字符 串 

从 哪 来 以 及 它们 的 含义 ， 这 依赖 于 工具 来 解释 。 当 使 用 go 工具 (参考 第 10 章 ) 时 ， 一 个 导 

和 路径 标注 一 个 目录 ， 目 录 中 包含 构成 包 的 一 个 或 多 个 Go 源 文件 。 除 了 导入 路 径 之 外 ， 每 

个 包 还 有 一 个 包 名 ， 它 以 短 名 字 的 形式 〈 且 不 必 是 唯一 的 ) 出 现在 包 的 声明 中 。 按 约定 ， 包 

名 匹配 导入 路 径 的 最 后 一 段 ， 这 样 可 以 方便 地 预测 gop1.io/ch2/tempconv 的 包 名 是 tempconv。 
为 了 使 用 gopl.io/ch2/tempconv， 必 须 导 人 它 : 


gopl1.io/ch2/cf 
// cf 把 它 的 数值 参数 转换 为 摄氏 温度 和 华氏 温度 


package main 


import ( 
"fmt" 
"os" 
"strconv" 


"gopl.io/ch2/tempconv" 


func main() { 
for _, arg := range os.Args[1:] { 
t, err := strconv.ParseFloat(arg, 64) 
if err != nil { 
fmt.Fprintf(os.Stderr, "cf: %v\n", err) 
os.Exit(1) 


:= tempconv.Celsius(t) 
mt.Printf("%s = %s, %s = %s\n", 
f, tempconv.FToC(f), c, tempconv.CToF(c)) 


} 

f := tempconv.Fahrenheit(t) 
C := 

和 | 


} 
} 
导入 声明 可 以 给 导入 的 包 绑 定 一 个 短 名 字 ， 用 来 在 整个 文件 中 引用 包 的 内 容 。 上 面 的 
import 可 以 使 用 修饰 标识 符 来 引用 gopl.io/ch2/tempconv 包 里 的 变量 名 ， 如 tempconv.CcToF。 
默认 这 个 短 名 字 是 包 名 ， 在 本 例 中 是 tempconv， 但 是 导 人 声明 可 以 设 定 一 个 可 选 的 名 字 来 避 
免 冲 突 (参考 10.4 节 )。 
cf 程序 将 一 个 数字 型 的 命令 行 参数 分 别 转换 成 摄氏 温度 和 华氏 温度 : 


$ go build gopl.io/ch2/cf 


$ a ef 32 

32°F = @°C, 32°C = 89.6°F 

$ wef 212 

212°F = 100°C, 212°C = 413.6°F 
$ ./cf -46 


-40°F = -40°C, -40°C = -46oF 


如 果 导 入 一 个 没有 被 引用 的 包 ， 就 会 触发 一 个 错误 。 这 个 检查 帮助 消除 代码 演进 过 
程 中 不 再 需要 的 依赖 (尽管 它 在 调试 过 程 中 会 带 来 一 些 麻烦 )， 因 为 注释 掉 一 条 诸如 log， 
Print("got herel") 之 类 的 代码 ， 可 能 去 除了 对 于 log 包 唯 一 的 一 个 引用 ， 导 致 编译 器 报错 。 
这 种 情况 下 ， 需 要 注释 掉 或 者 删 掉 不 必要 的 import。 

练习 2.2 : 写 一 个 类 似 于 cf 的 通用 的 单位 转换 程序 ， 从 命令 行 参数 或 者 标准 输入 (如果 
没有 参数 ) 获取 数字 ， 然 后 将 每 一 个 数字 转换 为 以 摄氏 温度 和 华氏 温度 表示 的 温度 ， 以 英寸 
和 米 表 示 的 长 度 单位 ， 以 磅 和 千克 表示 的 重量 ， 等 等 。 
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2.6.2 包 初 始 化 


包 的 初始 化 从 初始 化 包 级 别 的 变量 开始 ， 这 些 变量 按照 声明 顺序 初始 化 ， 在 依赖 已 解析 
完毕 的 情况 下 ， 根 据 依赖 的 顺序 进行 。 


var a= b+cc // 最 后 把 a 初始 化 为 3 
var b = f() // 通过 调用 千 接 着 把 b 初始 化 为 2 
var c = 1 // 首先 初始 化 为 1 


func f() int { return c+1} 


如 果 包 由 多 个 .go 文件 组 成 ， 初 始 化 按照 编译 器 收 到 文件 的 顺序 进行 : go 工具 会 在 调用 
编译 器 前 将 .go 文件 进行 排序 。 

对 于 包 级 别 的 每 一 个 变量 ， 生 命 周 期 从 其 值 被 初始 化 开始 ， 但 是 对 于 其 他 一 些 变量 ， 比 
如 数据 表 ， 初 始 化 表达 式 不 是 简单 地 设置 它 的 初始 化 值 。 这 种 情况 下 ,，init 函数 的 机 制 会 比 
较 简 单 。 任 何 文件 可 以 包含 任意 数量 的 声明 如 下 的 函数 : 


finc init() { /A* ws */ 


这 个 init 函数 不 能 被 调用 和 被 引用 ， 另 一 方面 ， 它 也 是 普通 的 函数 。 在 每 一 个 文件 里 ， 
当 程 序 启 动 的 时 候 ，init 函数 按照 它们 声明 的 顺序 自动 执行 。 

包 的 初始 化 按照 在 程序 中 导入 的 顺序 来 进行 ， 依 赖 顺序 优先 ， 每 次 初始 化 一 个 包 。 因 此 ， 
如 果 包 p 导 和 人 了 包 q， 可 以 确保 q 在 p 之 前 已 完全 初始 化 。 初 始 化 过 程 是 自 下 向 上 的 ，main 包 
最 后 初始 化 。 在 这 种 方式 下 ， 在 程序 的 main 函数 开始 执行 前 ， 所 有 的 包 已 初始 化 完毕 。 | 

下 面 的 包 定 义 了 一 个 Popcount 函数 ， 它 返回 一 个 数字 中 被 置 位 的 个 数 ， 即 在 一 个 uint64 
的 值 中 ， 值 为 1 的 位 的 个 数 ， 这 称 为 种 群 统计 。 它 使 用 init 函数 来 针对 每 一 个 可 能 的 8 位 
值 预 计算 一 个 结果 表 pc， 这 样 Popcount 只 需要 将 8 个 快 查 表 的 结果 相 加 而 不 用 进行 64 步 的 
计算 。( 这 个 不 是 最 快 的 统计 位 算法 ， 只 是 方便 用 来 说 明 init 函数 ， 用 来 展示 如 何 预 计算 一 
个 数值 表 ， 它 是 一 种 很 有 用 的 编程 技术 。) 
gopl.io/ch2/popcount 

package popcount 


// pc[i] 是 主 的 种 群 统计 
var pc [256]byte 


func init() { 
for i := range pc { 
pc[i] = pc[i/2] + byte(i&1) 


} 


// PopCount 返回 x 的 种 群 统计 ( 置 位 的 个 数 ) 
func PopCount(x uint64) int { 
return int(pc[byte(x>>(8@*8))] + 

pc[byte(x>>(1*8))] 
pc[byte(x>>(2*8))] 
pc[byte(x>>(3*8))] 
pc[byte(x>>(4*8))] 
pc[byte(x>>(5*8))] 
pc[byte(x>>(6*8))] + 
pc[byte(x>>(7*8))]) 


十 


+ + + + 


} 
注意 ，init 中 的 range 循环 只 使 用 索引 ; 值 不 是 必需 的 ， 所 以 没 必要 包含 进来 。 循 环 可 
以 重 写 为 下 面 的 形式 : 
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for i, _ := range pc { 


我 们 将 在 下 一 节 和 10.5 节 看 到 init 函数 的 其 他 用 途 。 

练习 2.3 : 使 用 循环 重 写 Popcount 来 代替 单个 表达 式 。 对 比 两 个 版 本 的 效率 。( 11.4 节 
会 展示 如 何 系统 性 地 对 比 不 同 实现 的 性 能 。) 

练习 2.4 : 写 一 个 用 于 统计 位 的 Popcount， 它 在 其 实际 参数 的 64 位 上 执行 移 位 操作 ， 每 
次 判断 最 右边 的 位 ， 进 而 实现 统计 功能 。 把 它 与 快 查 表 版 本 的 性 能 进行 对 比 。 

练习 2.5: 使 用 x&(x-1) 可 以 清除 x 最 右边 的 非 零 位 ， 利 用 该 特点 写 一 个 PopCount ， 然 后 
评价 它 的 性 能 。 


2.7 ”作用 域 


声明 将 名 字 和 程序 实体 关联 起 来 ， 如 一 个 函数 或 一 个 变量 。 声 明 的 作用 域 是 指 用 到 声明 
时 所 声明 名 字 的 源 代码 段 。 

“不 要 将 作用 域 和 生命 周期 混淆 。 声明 的 作用 域 是 声明 在 程序 文本 中 出 现 的 区 域 ， 它 是 一 
个 编译 时 属性 。 变 量 的 生命 周期 是 变量 在 程序 执行 期 间 能 被 程序 的 其 他 部 分 所 引用 的 起 止 时 
间 ， 它 是 一 个 运行 时 属性 。 

语法 块 (block) 是 由 大 括号 围 起 来 的 一 个 语句 序列 ， 比 如 一 个 循环 体 或 函数 体 。 在 语法 
块 内 部 声明 的 变量 对 块 外 部 不 可 见 。 块 把 声明 包围 起 来 ， 并 且 决 定 了 它 的 可 见 性 。 我 们 可 以 
把 块 的 概念 推广 到 其 他 没有 显 式 包含 在 大 括号 中 的 声明 代码 ， 将 其 统称 为 词法 块 。 包 含 了 全 
部 源 代码 的 词法 块 ， 叫 作 全 局 块 。 每 一 个 包 ， 每 一 个 文件 ， 每 一 个 for、if 和 switch 语句， 
以 及 switch 和 select 语句 中 的 每 一 个 条 件 ， 都 是 写 在 一 个 词法 块 里 的 。 当 然 ， 显 式 写 在 大 
括号 语法 里 的 代码 块 也 算是 一 个 词法 块 。 

一 个 声明 的 词法 块 决定 声明 的 作用 域 大 小 。 像 int 、len 和 true 等 内 置 类 型 、 也 数 或 常量 
在 全 局 块 中 声明 并 且 对 于 整个 程序 可 见 。 在 包 级 别 (就 是 在 任何 函数 外 ) 的 声明 ， 可 以 被 同一 
个 包 里 的 任何 文件 引用 。 导 入 的 包 (比如 在 tempconv 例子 中 的 fmt) 是 文件 级 别 的 ， 所 以 它们 
可 以 在 同一 个 文件 内 引用 ， 但 是 不 能 在 没有 另 一 个 import 语句 的 前 提 下 被 同一 个 包 中 其 他 文 
件 中 的 东西 引用 。 许 多 声明 ( 像 tempconv.cToF 函数 中 变量 c 的 声明 ) 是 局 部 的 ， 仅 可 在 同一 
个 函数 中 或 者 仅仅 是 函数 的 一 部 分 所 引用 。 

控制 流标 签 (如 break、continue 和 goto 语句 使 用 的 标签 ) 的 作用 域 是 整个 外 层 的 函数 
(enclosing function ) 。 

一 个 程序 可 以 包含 多 个 同名 的 声明 ， 前 提 是 它们 在 不 同 词法 块 中 。 例 如 可 以 声明 一 个 和 
包 级 别 变量 同名 的 局 部 变量 。 或 者 像 2.3.3 节 展 示 的 ， 可 以 声明 一 个 叫 作 new 的 参数 ， 即 使 
它 是 一 个 全 局 块 中 预 声 明 的 函数 。 然 而 ， 不 要 滥用 ， 重 声明 所 涉及 的 作用 域 越 广 ， 越 可 能 影 
响 其 他 的 代码 。 

当 编 译 器 遇 到 一 个 名 字 的 引用 时 ， 将 从 最 内 层 的 封闭 词法 块 到 全 局 块 寻找 其 声明 。 如 果 
没有 找到 ， 它 会 报 “undeclared name ”错误 ; 如 果 在 内 层 和 外 层 块 都 存在 这 个 声明 ， 内 层 
的 将 先 被 找到 。 这 种 情况 下 ， 内 层 声明 将 履 盖 外 部 声明 ， 使 它 不 可 访问 : 

func f() {} 


var g = "g" 
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func main() { 
en 
fmt.Println(f) //"f"; 局 部 变量 于 覆盖 了 包 级 函数 二 
fmt.Println(g) //"g"; 包 级 变量 
fmt.Println(h) // 编译 错误 : 未 定义 h 
在 了 数 里 面 ， 词 法 块 可 能 艇 套 很 深 ， 所 以 一 个 局 部 变量 声明 可 能 覆盖 另 一 个 。 很 多 词法 
块 使 用 if 语句 和 for 循环 这 类 控制 流 结构 构建 。 下 面 的 程序 有 三 个 称 为 x 的 不 同 的 变量 声 
明 ， 因 为 每 个 声明 出 现在 不 同 的 词法 块 。( 这 个 例子 只 是 用 来 说 明 作 用 域 的 规则 ， 风 格 并 不 
完美 ! ) 


func main() { 


= "hello!" 
for i := 0@; i < len(x); i++ { 
x := x[i] 
jf Se Pe: “A 
X :=X+'A' "a 


fmt.Printf("%c",， xXx) // “HELLO"” (每 次 迭代 一 个 字母 ) 


表达 式 x[i] 和 x + 'A' - 'a' 都 引用 了 在 外 层 声明 的 x， 稍 后 我 们 会 解释 它 。( 注 意 ， 后 
面 的 表达 式 不 同 于 unicode.Toupper 函数 。) 

如 上 所 述 ， 不 是 所 有 的 词法 块 都 对 应 于 显 式 大 括号 包围 的 语句 序列 ， 有 一 些 词法 块 是 隐 
式 的 。for 循环 创建 了 两 个 词法 块 : 一 个 是 循环 体 本 身 的 显 式 块 ， 以 及 一 个 隐 式 块 ， 它 包含 
了 一 个 闭合 结构 ， 其 中 就 有 初始 化 语句 中 声明 的 变量 ， 如 变量 1i。 隐 式 块 中 声明 的 变量 的 作 
用 域 包括 条 件 、 后 置 语句 (i++)， 以 及 for 语句 体 本 身 。 

下 面 的 例子 也 有 三 个 名 字 为 x 的 变量 ， 每 一 个 都 在 不 同 的 词法 块 中 声明 : 一 个 在 函数 体 
中 ， 一 个 在 for 语句 块 中 ， 一 个 在 循环 体 中 。 但 只 有 两 个 块 是 显 式 的 ; 


func main() { 


x := "hello" 
for _, x := range x { 

xX:=X+'A' - 'a' 

fmt .Printf("%c"，Xx) // “HELLO" (每 次 迭代 一 个 字母 ) 
} 


} 


像 for 循环 一 样 ， 除 了 本 身 的 主体 块 之 外 ，if 和 switch 语句 还 会 创建 隐 式 的 词法 块 。 下 
面 的 if-else 链 展示 x 和 y 的 作用 域 : 


Lf ST) 
fmt.Println(x) 

} else if y := g(x); x ==y{ 
fmt.Println(x, y) 

} else { 
fmt.Println(x, y) 


} 
fmt.Println(x，y) // 编译 错误 : x 与 y 在 这 里 不 可 见 


第 二 个 if 语句 舱 套 在 第 一 个 中 ， 所 以 第 一 下 
句 中 是 可 见 的 。 同 样 的 规则 可 以 应 用 于 switch 语句 : 条 件 对 应 一 个 块 ， 每 个 case 语句 体 对 
应 一 个 块 。 
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在 包 级 别 ， 声 明 的 顺序 和 它们 的 作用 域 没 有 关系 ， 所 以 一 个 声明 可 以 引用 它 自己 或 者 跟 
在 它 后 面 的 其 他 声明 ， 使 我 们 可 以 声明 递归 或 相互 递归 的 类 型 和 函数 。 如 果 常 量 或 变量 声明 
引用 它 自己 ， 则 编译 器 会 报错 。 

在 以 下 程序 中 : 

if f，err := os.0pen(fname);j err != nil { // 编译 错误 : 未 使 用 下 


return err 


} 

f.stat() // 编译 错误 : 未 定义 下 

f.Close() // 编译 错误 : 未 定义 下 
f 变量 的 作用 域 是 if 语句 ， 所 以 f 不 能 被 接 下 来 的 语句 访问 ， 编 译 器 会 报错 。 根 据 编译 融 的 
不 同 ， 也 可 能 收 到 其 他 报错 : 局 部 变量 f 没 有 使 用 。 

所 以 通常 需要 在 条 件 判断 之 前 声明 f， 使 其 在 if 语句 后 面 可 以 访问 : 

f, err := 0s.0pen(fname) 


if err != nil { 
return err 


小 
f.Stat() 
f.Close() 


你 可 能 希望 避免 在 外 部 块 中 声明 f 和 err， 方 法 是 将 stat 和 close 的 调用 放 到 else 块 中 


if f，err := os.Open(fname); err != nil { 
return err 
} else { 
// 下 与 err 在 这 里 可 见 
f.Stat() 
f.Close() 
} 


通常 Go 中 的 做 法 是 在 if 块 中 处 理 错误 然后 返回 ， 这 样 成 功 执行 的 路 径 不 会 被 变 得 支 离 
破碎 。 

短 变量 声明 依赖 一 个 明确 的 作用 域 。 考 虑 下 面 的 程序 ， 它 获取 当前 的 工作 目录 然后 把 
它 保 存在 一 个 包 级 别 的 变量 里 。 这 通过 在 main 函数 中 调用 os.6etwd 来 完成 ， 但 是 最 好 可 以 
从 主 逻 辑 中 分 离 ， 特 别 是 在 获取 目录 失败 是 致命 错误 的 情况 下 。 函 数 log ,Fatalf 输出 一 条 消 
息 ， 然 后 调用 os.Exit(1) 退出 。 

var cwd string 


func init() { 
cwd，err := os.Getwd() // 编译 错误 : 未 使 用 cwd 
if err != nil { 
log.Fatalf("os.Getwd failed: %v", err) 


} 


因为 cwd 和 err 在 init 函数 块 的 内 部 都 尚未 声明 ， 所 以 := 语句 将 它们 都 声明 为 局 部 变量 。 
内 层 cwd 的 声明 让 外 部 的 声明 不 可 见 ， 所 以 这 个 语句 没有 按 预 期 更 新 包 级 别 的 cwd 变量 。 

当前 Go 编译 器 检测 到 局 部 的 cwd 变量 没有 被 使 用 ， 然 后 报错 ， 但 是 不 必 严 格 执行 这 种 
检查 。 进 一 步 做 一 个 小 的 修改 ， 比 如 增加 引用 局 部 cwd 变量 的 日 志 语 句 就 可 以 让 检查 失效 。 
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var cwd string 
func init() { 
cwd，err := 0S.Getwd() // 注意 : 错误 
if err != nil { 
log.Fatalf("os.Getwd failed: %v", err) 


log.Printf("Working directory = %s", cwd) 
} 


全 局 的 cwd 变量 依然 未 初始 化 ， 看 起 来 一 个 普通 的 日 志 输 出 让 bug 变 得 不 明显 。 

处 理 这 种 潜在 的 问题 有 许多 方法 。 最 直接 的 方法 是 在 另 一 个 var 声明 中 声明 err， 和 避免 
使 用 :=。 

var cwd string 


func init() { 
var err error 
cwd, err = 0s.Getwd() 
if err != nil { 
log.Fatalf("os.Getwd failed: %v", err) 
} 
} 


现在 我 们 已 经 看 到 包 、 文 件 、 声 明 以 及 语句 是 如 何 来 构成 程序 的 。 接 下 来 的 两 章 将 要 讨 
论 数 据 的 结构 。 
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The Go Programming Language 


基本 数据 


毫 无 疑问 ， 计 算 机 底层 全 是 位 ， 而 实际 操作 则 是 基于 大 小 固定 的 单元 中 的 数值 ， 称 为 字 
(word)， 这 些 值 可 解释 为 整数 、 浮 点 数 、 位 集 (bitset) 或 内 存 地 址 等 ， 进 而 构成 更 大 的 聚合 
体 ， 以 表示 数据 包 、 像 素 、 文 件 、 诗 集 ， 以 及 其 他 种 种 。Go 的 数据 类 型 宽泛 ， 并 有 多 种 组 
织 方式 ， 向 下 匹配 硬件 特性 ， 向 上 满足 程序 员 所 需 ， 从 而 可 以 方便 地 表示 复杂 数据 结构 。 

Go 的 数据 类 型 分 四 大 类 : 基础 类 型 (basic type)、 聚 合 类 型 (aggregate type)、 引 用 类 型 
(reference type) 和 接口 类 型 (interface type)。 本 章 的 主题 是 基础 类 型 ， 包 括 数字 (number)、 
字符 串 (string) 和 布尔 型 (boolean)。 聚 合 类 型 一 一 数组 (array， 见 4.1 节 ) 和 结构 体 
(struct， 见 4.4 节 ) 是 通过 组 合 各 种 简单 类 型 得 到 的 更 复杂 的 数据 类 型 。 引 用 是 一 大 分 
类 ， 其 中 包含 多 种 不 同类 型 ， 如 指针 (pointer， 见 2.3.2 节 )，slice ( 见 4.2 节 )，map ( 见 4.3 
节 )， 函 数 ( function， 见 第 5 章 )， 以 及 通道 ( channel， 见 第 8 章 )。 它 们 的 共同 点 是 全 都 间 
接 指向 程序 变量 或 状态 ， 于 是 操作 所 引用 数据 的 效果 就 会 遍及 该 数据 的 全 部 引用 。 接 口 类 型 
将 在 第 7 章 讨论 。 


3.1 整数 


Go 的 数值 类 型 包括 了 几 种 不 同 大 小 的 整数 、 浮 点 数 和 复数 。 各 种 数值 类 型 分 别 有 自 己 
的 大 小 ， 对 正 负 号 支持 也 各 异 。 我 们 从 整数 开始 。 

Go 同时 具备 有 符号 整数 和 无 符号 整数 。 有 符号 整数 分 四 种 大 小 : 8 位 、16 位 、32 位 、64 
位 ， 用 int8、int16 、int32、int64 表示 ， 对 应 的 无 符号 整数 是 uint8、uint16 、unint32、uint64。 

此 外 还 有 两 种 类 型 int 和 uint。 在 特定 平台 上 ， 其 大 小 与 原生 的 有 符号 整数 \ 无 符号 整 
数 相同 ， 或 等 于 该 平台 上 的 运算 效率 最 高 的 值 。int 是 目前 使 用 最 广泛 的 数值 类 型 。 这 两 种 
类 型 大 小 相等 ， 都 是 32 位 或 64 位 ， 但 不 能 认为 它们 一 定 就 是 32 位 ， 或 一 定 就 是 64 位 ; 即 
使 在 同样 的 硬件 平台 上 ， 不 同 的 编译 器 可 能 选用 不 同 的 大 小 。 

rune 类 型 是 int32 类 型 的 同义词 ， 常 常用 于 指明 一 个 值 是 Unicode 码 点 〈code point)。 
这 两 个 名 称 可 互 换 使 用 。 同 样 ，byte 类 型 是 uint8 类 型 的 同义词 ， 强 调 一 个 值 是 原始 数据 ， 
而 非 量 值 。 

最 后 ， 还 有 一 种 无 符号 整数 uintptr， 其 大 小 并 不 明确 ， 但 足以 完整 存放 指针 。uintptr 
类 型 仅仅 用 于 底层 编程 ， 例 如 在 Go 程序 与 C 程序 库 或 操作 系统 的 接口 界面 。 第 13 章 介绍 
unsafe 包 ， 将 会 结合 uintptr 举例 。 

int 、uint 和 uintptr 都 有 别 于 其 大 小 明确 的 相似 类 型 的 类 型 。 就 是 说 ，int 和 int32 是 
不 同类 型 ， 尽 管 int 天 然 的 大 小 就 是 32 位 ， 并 且 int 值 若 要 当 作 int32 使 用 ， 必 须 显 式 转 
换 ; 反之 亦 然 。 

有 符号 整数 以 补 码 表示 ， 保 留 最 高 位 作为 符号 位 , 位 数字 的 取 值 范围 是 -2” 一 
2' -1。 无 符号 整数 由 全 部 位 构成 其 非 负 值 ， 范 围 是 0 一 2 -1。 例如 ，ints 可 以 从 -128 
到 127 取 值 ， 而 unit8 从 0 到 255 取 值 。 
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Go 的 二 元 操作 符 涵盖 了 算术 、 逻 辑 和 比较 等 运算 。 按 优先 级 的 降序 排列 如 下 : 


* / % << >> & &^ 


二 元 运算 符 分 五 大 优先 级 。 同 级 别 的 运算 符 满 足 左 结合 律 ， 为 求 清晰 ， 可 能 需要 圆 括 
号 ， 或 为 使 表达 式 内 的 运算 符 按 指定 次 序 计 算 ， 如 mask & (1<<28)。 

上 述 列 表 中 前 两 行 的 运算 符 (如 加 法 运算 +) 都 有 对 应 的 赋值 运算 符 (如 +=)， 用 于 简写 
赋值 语句 。 

算术 运算 符 +、-、*、/ 可 应 用 于 整数 、 浮 点 数 和 复数 ， 而 取 模 运算 符 % 仅 能 用 于 整数 。 
取 模 运 算 符 % 的 行为 因 编程 语言 而 异 。 就 Go 而 言 ， 取 模 余数 的 正 负 号 总 是 与 被 除数 一 致 ， 
于 是 -5%3 和 -5%-3 都 得 -2。 除 法 运算 (/) 的 行为 取决 于 操作 数 是 否 都 为 整 型 ， 整 数 相 除 ， 商 
会 舍弃 小 数 部 分 ， 于 是 5.8/4.8 得 到 1.25， 而 5/4 结果 是 1。 

不 论 是 有 符号 数 还 是 无 符号 数 ， 若 表示 算术 运算 结果 所 需 的 位 超出 该 类 型 的 范围 ， 就 称 
为 溢出 。 洲 出 的 高 位 部 分 会 无 提示 地 丢弃 。 假 如 原本 的 计算 结果 是 有 符号 类 型 ， 且 最 左 侧 位 
是 1， 则 会 形成 负 值 ， 以 ints 为 例 : 


var U uint8 = 255 
fmt.Println(u, u+1, u*u) // "255 86 1" 


过 


var i int8 = 127 
fmt.Println(i, i+1, i*i) // "127 -128 1" 


下 列 二 元 比较 运算 符 用 于 比较 两 个 类 型 相同 的 整数 ， 比 较 表达 式 本 身 的 类 型 是 布尔 型 。 


== 等 于 
1= 不 等 于 

< 小 于 

<= ”小 于 或 等 于 
> 


实际 上 ， 全 部 基本 类 型 的 值 (布尔 值 、 数 值 、 字 符 串 ) 都 可 以 比较 ， 这 意味 着 两 个 相同 类 
型 的 值 可 用 == 和 != 运算 符 比较 。 整 数 、 浮 点 数 和 字符 串 还 能 根据 比较 运算 符 排序 。 许 多 其 他 
类 型 的 值 是 不 可 比较 的 ， 也 无 法 排序 。 后 面 介 绍 每 种 类 型 时 ， 我 们 将 分 别 说 明 比 较 规则 。 

另外 ， 还 有 一 元 加 法 和 一 元 减法 运算 符 : 

+ ”一 元 取 正 (无 实际 影响 ) 

一 元 取 负 

对 于 整数 ，+x 是 erx 的 简写 ， 而 -x 则 为 e-x 的 简写 。 对 于 浮 点 数 和 复数 ，+x 就 是 x，-x 
为 x 的 负数 。 

Go 也 具备 下 列 位 运算 符 ， 前 四 个 对 操作 数 的 运算 逐 位 独立 进行 ， 不 涉及 算术 进位 或 正 
负 号 : 

& 位 运算 AND 

| ”位 运算 OR 

^ 位 运算 XOR 

&^ 位 清空 (AND NOT) 
《<< ， 左 移 

>> 右 移 
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如 果 作 为 二 元 运算 符 ， 运算 符 ^ 表示 按 位 “ 异 或 ”(XOR); 铬 作为 一 元 前 级 运算 符 ， 则 
它 表 示 按 位 取 反 或 按 位 取 补 ,运算 结果 就 是 操作 数 逐 位 取 反 。 运 算 符 &^ 是 按 位 清除 (AND 
NOT): 表达 式 z=x&^y 中 ,， 若 y 的 某 位 是 1， 则 z 的 对 应 位 等 于 0; 否则 ， 它 就 等 于 x 的 对 应 位 。 

下 面 的 代码 说 明了 如 何 用 位 运算 将 一 个 uint8 值 作为 位 集 (bitset) 处 理 ， 其 含有 8 个 独 
立 的 位 ， 高 效 且 紧 凑 。Printf 用 谓词 部 以 二 进 制 形式 输出 数值 ， 副 词 es 在 这 个 输出 结果 前 
被 零 ， 补 够 8 位 。 


var x uint8 = 1<<1 | 1<<5 
var y uint8 = 1¢<<1 | 1<<2 


fmt.Printf("%88b\n"，x) ”// "896198616"， 集 合 {1，5} 
fmt .Printf("%88b\n"，y) ”//“"66666116"， 集 合 {1，2} 


fmt.Printf("%e8b\n"，x&y) //“"686666616"， 交 集 {1} 
fmt.Printf("%e8b\n", x|y) //“"861686116"， 并 集 {1，2，5} 
fmt.Printf("%e@8b\n"，x^y) // "8686186166"， 对 称 差 {2，5} 
fmt.Printf("%88b\n"，Xx&^y) // "886166666"， 差 集 {5} 
for i := uint(@); i < 8; i++ { 
if x&(1<<i) != 8 { // 元 素 判定 
FmtobrintLy(ti) 359 





} 
} 


fmt.Printf("%68b\n"，x<<1) // "61666166"， 集 合 {2，6} 
fmt.Printf("%e8b\n"，x>>1) // "866616661"， 集 合 {06，4} 


( 6.5 节 会 介绍 比 单字 节 大 得 多 的 整数 位 集 的 实现 。) 

在 移 位 运算 xccn 和 x>>n 中 ， 操 作 数 n 决 定位 移 量 ， 而 且 n 必须 为 无 符号 型 ;操作 数 x 
可 以 是 有 符号 型 也 可 以 是 无 符号 型 。 算 术 上 ， 左 移 运算 xssn 等 价 于 x 乘 以 2^n ; 而 右 移 运算 
x>>n 等 价 于 x 除 以 2^n， 向 下 取 整 。 

左 移 以 0 填补 右边 空位 ， 无 符号 整数 右 移 同样 以 0 填补 左边 空位 ， 但 有 符号 数 的 右 移 操 
作 是 按 符号 位 的 值 填补 空位 。 因 此 ， 请 注意 ， 如 果 将 整数 以 位 模式 处 理 ， 须 使 用 无 符号 整 型 。 

尽管 Go 具备 无 符号 整 型 数 和 相关 算术 运算 ， 也 尽管 某 些 量 值 不 可 能 为 负 ， 但 是 我 们 往 
往 还 采用 有 符号 整 型 数 ， 如 数组 的 长 度 〈 即 便 直 观 上 明显 更 应 该 选用 uint)。 下 例 从 后 向 前 
输出 奖牌 名 称 ， 循 环 里 用 到 了 内 置 的 len 函数 ， 它 返回 有 符号 整数 : 


medals := []string{"gold", "silver", "bronze"} 
for i := len(medals) - 1; i >= 8; i-- { 
fmt.Println(medals[i]) // "bronze", "silver", "gold" 


} 

相反 ,假若 len 返回 的 结果 是 无 符号 整数 ， 就 会 导致 严重 错误 ， 因 为 i 随 之 也 成 为 uint 
型 ,根据 定义 ,条件 i>=e 将 恒 成 立 。 第 3 轮 迭 代 后 ， 有 i==@e， 语 句 i-- 使 得 i 变 为 uint 型 
的 最 大 值 (例如 ， 可 能 为 2%-1)， 而 非 1， 导致 medals[i] 试图 越界 访问 元 素 ， 超 出 slice 
范围 ， 引 发 运行 失败 或 宕 机 ( 见 5.9 节 )。 

因此 ,无 符号 整数 往往 只 用 于 位 运算 符 和 特定 算术 运算 符 ， 如 实现 位 集 时 ,解析 二 进 制 
格式 的 文件 ， 或 散 列 和 加 密 。 一 般 而 言 ， 无 符号 整数 极 少 用 于 表示 非 负 值 。 

通常 ， 将 某 种 类 型 的 值 转换 成 另 一 种 ， 需 要 显 式 转换 。 对 于 算术 和 逻辑 (不 含 移 位 ) 的 
二 元 运算 符 ， 其 操作 数 的 类 型 必须 相同 。 虽 然 这 有 时 会 导致 表达 式 相 对 宛 长 ， 但 是 一 整 类 错 
误 得 以 避免 ， 程 序 也 更 容易 理解 。 

考虑 下 面 的 语句 ， 它 与 某 些 其 他 场景 类 似 : 
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var apples int32 = 1 
var oranges int16 = 2 
var compote int = apples + oranges // 编译 错误 


尝试 编译 这 三 个 声明 将 产生 错误 消息 : 

非法 操作 : apples + oranges (int32 与 int16 类 型 不 匹配 ) 

类 型 不 匹配 (+ 的 问题 ) 有 几 种 方法 改正 ， 最 直接 地 ， 将 全 部 操作 数 转换 成 同一 类 型 ; 

var compote = int(apples) + int(oranges) 

2.5 节 已 经 提 及 ， 于 每 种 类 型 T， 若 允许 转换 ， 操 作 T(x) 会 将 x 的 值 转换 成 类 型 T。 很 
多 整 型 - 整 型 转换 不 会 引起 值 的 变化 ， 仅 告知 编译 器 应 如 何 解 读 该 值 。 不 过 ， 缩 减 大 小 的 整 
型 转换 ， 以 及 整 型 与 浮 点 型 的 相互 转换 ， 可 能 改变 值 或 损失 精度 


f := 3.141 // a float64 

ss int(f) 

fmt.Println(f, i) // "3.141 3" 
f= 1.99 


fmt.Println(int(f)) // "1" 


浮 点 型 转 成 整 型 ， 会 舍弃 小 数 部 分 ， 趋 零 截 尾 ( 正 值 向 下 取 整 ， 负 值 向 上 取 整 )。 如 果 
有 些 转 换 的 操作 数 的 值 超出 了 目标 类 型 的 取 值 范围 ， 就 应 当 避 免 这 种 转换 ， 因 为 其 行为 依赖 
具体 实现 : 

f := 1e166 // a float64 

i := int(f) // 结果 依赖 实现 

不 论 有 无 大 小 和 符号 限制 ,源码 中 的 整数 都 能 写成 常见 的 十 进 制 数 ， 也 能 写成 八进制 
数 ， 以 8 开头， 如 e666 ; 还 能 写成 十 六 进 制 数 ， 以 ex 或 ex 开头， 如 exdeadbeef。 十 六 进 制 
的 数字 (或 字母 ) 大 小 写 丝 可 。 当 前 ， 八 进 制 数 似乎 仅 有 一 种 用 途 一 一 表示 POSIX 文件 系统 
的 权限 一 一 而 十 六 进 制 数 广泛 用 于 强调 其 位 模式 ， 而 非 数值 大 小 。 

如 下 例 所 示 ， 如 果 使 用 fmt 包 输出 数字 ， 我 们 可 以 用 谓词 x#d、%o 和 %x 指定 进位 制 基数 
和 输出 格式 : 


0 := 6666 

fmt.Printf("%d %[1]o %#[1]o\n", 0o) // "438 666 8666" 
x := int64(6xdeadbeef) 

fmt.Printf("%d %[1]x %#[1]x %#[1]X\n", x) 

// 输出 : 

// 3735928559 deadbeef 6xdeadbeef 6XDEADBEEF 





注意 fmt 的 两 个 技巧 。 通 常 Printf 的 格式 化 字符 串 含 有 多 个 % 谓 词 ， 这 要 求 提供 相同 数 
目的 操作 数 ， 而 % 后 的 副词 [1] 告知 Printf 重复 使 用 第 一 个 操作 数 。 其 次 ，xo、%x 或 六 之 
前 的 副词 # 告知 Printf 输出 相应 的 前 级 6e、ex 或 ex。 

源码 中 ， 文 字符 号 (rune literal) 的 形式 是 字符 写 在 一 对 单 引 号 内 。 最 简单 的 例子 就 是 
ASCI 字符， 如 'a' ,但 也 可 以 直接 使 用 Unicode 码 点 (codepoint) 或 码 值 转 义 ， 稍 后 有 介绍 。 

用 %c 输出 文字 符号 ， 如 果 和 希望 输出 带 有 单 引 号 则 用 %q: 


ascii := “a' 
unicode := ' 国 " 
newline := '\n’' 


fmt.Printf("%d %[1]c %[1i]q\n", ascii) // "97 a 'a'" 
fmt.Printf("%d %[1]c %[1]Jq\n"，,unicode) // "22269 国 ' 国 '" 
fmt.Printf("%d %[1]q\n", newline) 2 “0 "\i” 
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3.2 浮 点 数 
Go 具有 两 种 大 小 的 浮 点 数 float32 和 float64。 其 算术 特性 遵从 IEEE 754 标准 ， 所 有 新 
式 CPU 都 支持 该 标准 。 

这 两 个 类 型 的 值 可 从 极 细微 到 超 宏 大 。math 包 给 出 了 浮 点 值 的 极限 。 常 量 math. 
MaxFloat32 是 float32 的 最 大 值 ， 大 约 为 3.4e38， 而 math.MaxFloat64 则 大 约 为 1.8e368。 相 应 
地 ， 最 小 的 正 浮 点 值 大 约 为 1.4e-45 和 4.9e-324。 

十 进 制 下 ，float32 的 有 效 数 字 大 约 是 6 位 ，float64 的 有 效 数 字 大 约 是 15 位 。 绝 大 多 
数 情况 下 ， 应 优先 选用 float64， 因 为 除非 格外 小 心 ， 和 否则 float32 的 运算 会 迅速 累积 误差 
另外 ，float32 能 精确 表示 的 正 整数 范围 有 限 : 


var f float32 = 16777216 // 1 << 24 
fmt.Println(f == f+1) // "true" 


在 源码 中 ， 浮 点 数 可 写成 小 数 ， 如 : 
const e = 2.71828 // (近似 值 ) 


小 数 点 前 的 数字 可 以 省 略 ( .787 )， 后 面 的 也 可 省 去 (1.)。 非 常 小 或 非常 大 的 数字 最 好 
使 用 科学 记 数 法 表示 ， 此 方法 在 数量 级 指数 前 写字 母 e 或 E: 


const Avogadro = 6.62214129e23 
const Planck = 6.62686957e-34 


浮 点 值 能 方便 地 通过 Printf 的 谓词 xg 输出 ， 该 谓词 会 自动 保持 足够 的 精度 ， 并 选择 最 
简洁 的 表示 方式 ,但 是 对 于 数据 表 ，%e (有 指数 ) 或 %f (无 指数 ) 的 形式 可 能 更 合适 。 这 三 
个 谓词 都 能 掌控 输出 宽度 和 数值 精度 。 


for x := 0; x < 8; x++ { 
fmt.Printf("x = %d e* = %8.3f\n", x, math.Exp(float64(x))) 
} 
上 面 的 代码 按 8 个 字符 的 宽度 输出 自然 对 数 e 的 各 个 寡 方 ， 结 果 保 留 三 位 小 数 : 
Xx = 0 ex = 1.666 
X=1 e*= 2.718 
Xx=2 e*= 7.389 
X=3 ex = 26.686 
X = 4 ex = 54.598 
Xx=5 er= 148.413 
Xx = 6 ex = 463.429 
Xx=7 e* = 1096.633 


除了 大 量 常 见 的 数学 函数 之 外 ，math 包 还 有 函数 用 于 创建 和 判断 IEEE 754 标准 定义 的 
特殊 值 : 正 无 穷 大 和 负 无 穷 大 ， 它 表示 超出 最 大 许可 值 的 数 及 除 以 零 的 商 ; 以 及 NaN (Not 
a Number)， 它 表示 数学 上 无 意义 的 运算 结果 (如 eye 或 sqrt(-1) )。 


var z float64 
fmt.Println(z, -z, 1/z, -1/z, z/z) // "8 -0 +Inf -Inf NaN" 


math.IsNaN 因数 判断 其 参数 是 否 是 非 数 值 ，math.NaN 函数 则 返回 非 数 值 (NaN)。 在 数字 
运算 中 ， 我 们 倾向 于 将 NaN 当 作 信和 号 值 ( sentinel value)， 但 直接 判断 具体 的 计算 结果 是 否 
为 NaN 可 能 导致 潜在 错误 ， 因 为 与 NaN 的 比较 总 不 成 立 (除了 !=， 它 总 是 与 == 相反 ): 


nan := math.NaN() 
fmt.Println(nan == nan, nan < nan, nan > nan) // "false false false" 
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一 个 函数 的 返回 值 是 浮 点 型 且 它 有 可 能 出 错 ， 那 么 最 好 单独 报错 ， 如 下 : 


func compute() (value float64, ok bool) { 
A ns 
if failed { 
return 8, false 


} 


return result, true 


} 


下 一 个 程序 以 浮 点 绘图 运算 为 例 。 它 根据 传人 两 个 参数 的 函数 z=f(x,y)， 绘 出 三 维 的 网 
线 状 曲面 ， 绘 制 过 程 中 运用 了 可 缩放 矢量 图 形 ( Scalable Vector Graphics，SVG )， 绘 制 线条 
的 一 种 标准 XML 格式 。 图 3-1 是 函数 sin(r)/r 的 图 形 输出 样 例 ， 其 中 r 为 sqrt(x*x+y*y)。 









0 过 
gy a 
Kol 0 


图 3-1 函数 sin(r)/r 的 图 形 输出 样 例 


gopl.io/ch3/surface 
// surface 函数 根据 一 个 三 维 曲 面 函 数 计算 并 生成 SVG 


package main 


import ( 
"fmt" 
"math" 

) 

const ( 
width, height = 666，326 // 以 像素 表示 的 画布 大 小 
cells = 166 // 网 格 单元 的 个 数 
xyrange = 36.6 // 坐标 轴 的 范围 (-xyrange. .+xyrange) 
xyscale = width / 2 / xyrange // x 或 y 轴 上 每 个 单位 长 度 的 像素 
zscale = height * 6.4 // z 轴 上 每 个 单位 长 度 的 像素 
angle = math.Pi / 6 // x、y 轴 的 角度 〈=38?) 

) 


var sin36，cos36 = math.Sin(angle), math.Cos(angle) // sin(36")，cos(36?) 


func main() { 
fmt.Printf("<svg xmlns='http://www.wW3.org/2666/Svg "+ 
"style='stroke: grey; fill: white; stroke-width: 80.7" 
"width="'%d' height="'%d'>", width, height) 
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for i := 8@; i < cells; i++ { 
for j := 6j j < cells; j++ { 
ax, ay := corner(i+1, j) 


bx, by := corner(i, j) 
Cx, Cy := corner(i, j+1) 
dx, dy := corner(i+1, j+1) 


fmt.Printf("<polygon points='%g,%g %g,%g %g,%g %g,%g'/>\n", 
ax, ay, bx, by, cx, cy, dx, dy) 
} 


小 
fmt.Println("</svg>") 


} 
func corner(i, j int) (float64, float64) { 
// 求 出 网 格 单元 (并 ,j) 的 顶点 坐标 (x,y) 
x := xyrange * (float64(i)/cells - 6.5) 
y := xyrange * (float64(j)/cells - 6.5) 
// 计算 曲面 高 度 z 
z := f(x, y) 
// 将 (X,Yy,z) 等 角 投射 到 二 维 SVG 绘图 平面 上 ， 坐 标 是 (sx, sy) 
Sx := Width/2 + (x-y)*cos36*xyscale 
Sy := height/2 + (x+y)*sin3@*xyscale - z*zscale 
return sx, sy 


} 


func f(x, y float64) float64 { 
r := math.Hypot(x，y) // 到 (8,8) 的 距离 
return math.Sin(r) / 


} 

注意 ，corner 函数 返回 两 个 值 ， 构 成 网 格 单元 其 中 一 角 的 坐标 。 

理解 这 段 程 序 只 需 基 本 的 几何 知识 ， 但 略 过 也 无 妨 ， 因 为 本 例 旨 在 说 明 浮 点 运算 。 这 段 
程序 本 质 上 是 三 套 不 同 坐 标 系 的 相互 映射 ， 见 图 3-2。 首 先是 个 包含 100 x 100 个 单元 的 二 
维 网 格 ， 每 个 网 格 单元 用 整数 坐标 (i, j) 标记 ， 从 最 远 处 靠 后 的 角落 (0, 0 ) 开始 。 我 们 从 
后 向 前 绘制 ， 因 而 后 方 的 多 边 形 可 能 被 前 方 的 遮 住 。 
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3-2 三 套 不 同 坐 标 系 


第 二 个 坐标 系 内 ， 网 格 由 三 维 浮 点 数 (x, y, z) 决定 ， 其 中 x 和 yy 由 i 和 jj 的 线性 函数 决 
定 ， 经 过 坐标 转换 ， 原 点 处 于 中 央 ， 并 且 坐 标 系 按 照 xyrange 进行 缩放 。 高 度 值 z 由 曲面 函 
数 太 (xz,y) 决定 。 


标记 作 ( sx, sy)。 我 们 用 等 角 投 影 (isometric projection ) 将 三 维 坐标 点 (x, y, z) 映射 到 二 维 ， 
绘图 平面 上 。 若 一 个 点 的 x 值 越 大 , y 值 越 小 ， 则 其 在 绘图 平面 上 看 起 来 就 越 接近 右 方 。 而 
奉 一 个 点 的 x 值 或 y 值 越 大 ， 且 z 值 越 小 ， 则 其 在 绘图 平面 上 看 起 来 就 越 接 近 下 方 。 纵 向 
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(x) 与 横向 (y) 的 缩放 系数 是 由 30° 角 的 正弦 值 和 余弦 值 推导 而 得 。 z 方向 的 缩放 系数 为 0.4， 
是 个 随意 选 定 的 参数 值 。 

二 维 网 格 中 的 单元 由 main 函数 处 理 ， 它 算出 多 边 形 4BCD 在 绘图 平面 上 四 个 顶点 的 坐 
标 ， 其 中 8B 对 应 (i, 站 4、C、D 则 为 其 他 三 个 项 点， 然后 再 输出 一 条 SVG 指令 将 其 绘 出 。 

练习 3.1: 假如 函数 f 返 回 一 个 float64 型 的 无 穷 大 值 ， 就 会 导致 SVG 文件 含有 无 效 的 
<polygon> 元 素 ( 尽管 很 多 SVG 绘图 程序 对 此 处 理 得 当 )。 修 改 本 程序 以 避免 无 效 多 边 形 。 

练习 3.2: 用 math 包 的 其 他 函数 试验 可 视 化 效果 。 你 能 和 否 生 成 各 种 曲面 ， 分 别 呈 鸡蛋 盒 
状 、 雪 坡 状 或 马鞍 状 ? 

练习 3.3: 按 高 度 给 每 个 多 边 形 上 色 ， 使 得 峰 顶 呈 红 色 ( #ffeeee )， 谷 底 呈 蓝 色 〈#e@eeeff )。 

练习 3.4: 仿照 1.7 节 的 示例 Lissajous 的 方法 ， 构 建 一 个 Web 服务器， 计算 并 生成 曲面 ， 
同时 将 SVG 数据 写 人 客户 端 。 服 务 器 必须 如 下 设置 content-Type 报头 。 

w.Header().Set("Content-Type", "image/svg+xml") 

(在 Lissajous 示例 中 ， 这 一 步 并 不 强制 要 求 ， 因 为 该 服务 器 使 用 标准 的 启发 式 规则 ， 根 
据 响 应 内 容 最 前 面 的 512 字 节 来 识别 常见 的 格式 (如 PNG)， 并 生成 正确 的 HTTP 报头 。) 允 
许 客 户 端 通过 HTTP 请 求 参数 的 形式 指定 各 种 值 ， 如 高 度 、 宽 度 和 颜色 。 


3.3 复数 

Go 具备 两 种 大 小 的 复数 complex64 和 complex128， 二 者 分 别 由 float32 和 float64 构成 。 
内 置 的 complex 函数 根据 给 定 的 实 部 和 虚 部 创建 复数 ， 而 内 置 的 real 函数 和 imag 函数 则 分 
别提 取 复 数 的 实 部 和 虚 部 : 


var x complex128 = complex(1, 2) // 1+2i 
var y complex128 = complex(3, 4) // 3+4i 


fmt.Println(x*y) // "(-5+1060i)" 
fmt.Println(real(x*y)) ss 
fmt.Println(imag(x*y)) 人 10° 


源码 中 ， 如 果 在 浮 点 数 或 十 进 制 整数 后 面 紧 接着 写字 母 1， 如 3.141592i 或 2i1， 它 就 变 
成 一 个 虚数 ， 表 示 一 个 实 部 为 0 的 复数 : 


fmt.Println(1i * 1i) // "(-1+0i)", i2 = -1 
根据 常量 运算 规则 ， 复 数 常量 可 以 和 其 他 常量 相 加 ( 整 型 或 浮 点 型 实数 和 虚数 丝 可 )， 
这 让 我 们 可 以 自然 地 写 出 复数 ， 如 1+2i1， 或 等 价 地 ，2i+1。 前 面 x 和 y 的 声明 可 以 简写 为 : 


x:=1+2i 
:= 3+4i 


可 以 用 == 或 != 判断 复数 是 否 等 值 。 若 两 个 复数 的 实 部 和 虚 部 都 相等 ， 则 它们 相等 。 
math/cmplx 包 提 供 了 复数 运算 所 需 的 库 函 数 ， 例 如 复数 的 平方 根 函 数 和 复数 的 蜘 函 数 。 


fmt.Println(cmplx.Sqrt(-1)) // "(8+1i)" 


下 面 的 程序 用 complex128 运算 生成 一 个 Mandelbrot 集 。 


gopl1.io/ch3/mandelbrot 


// mandelbrot 函数 生成 一 个 PNG 格式 的 Mandelbrot 分 形 图 
package main 
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import ( 
"image" 
"image/color" 
"image/png" 
"math/cmplx" 
"os" 
) 
func main() { 
const ( 
xmin, ymin, xmax, ymax = -2, -2, +2, +2 
width, height = 1624，1624 
) 


img := image.NewRGBA(image.Rect(60, 0, width, height)) 
for py := 8; py < height; py++ { 
y := float64(py)/height*(ymax-ymin) + ymin 
for px := 8@; px < width; px++ { 
x := float64(px)/width*(xmax-xmin) + xmin 
:= complex(x, y) 
// 点 (px，py) 表示 复数 值 z 
img.Set(px, py, mandelbrot(z)) 


} 
png.Encode(os.Stdout，img) // 注意 : 忽略 错误 


func mandelbrot(z complex128) color.Color { 
const iterations = 266 
const contrast = 15 


var v complex128 
for n := uint8(0); n < iterations; n++ { 
V= Vt+vVv+2z 
if cmplx.Abs(v) > 2 { 
return color .Gray{255 - contrast*n} 


} 
} 


return color.Black 


} 


两 个 散 套 循环 在 1024 x 1024 的 灰 度 图 上 逐 行 扫描 每 
个 点 ， 这 个 图 表示 复 平面 上 -2 ~ +2 的 区 域 ， 每 个 点 都 对 
一 个 复数 。 该 程序 针对 各 个 点 反复 迭代 计算 其 平方 与 自 
身 的 和 ,判断 其 最 终 能 否 “ 超 出 ”半径 为 2 的 圆 。 若 然 ， 
就 根据 超出 圆 边界 所 需 的 迭代 次 数 设 定 该 点 的 灰 度 。 否 
则 ,该 点 属于 Mandelbrot 集 ， 颜 色 留 黑 。 最 后 ， 程 序 将 标 
准 输出 的 数据 写 和 人 PNG 图 ， 得 到 一 个 标志 性 的 分 形 ， 见 
图 3-3。 
练习 3.5 : 用 image.NewRGBA 困 数 和 color.RGBA 类 型 或 





color.YCbcr 类 型 实现 一 个 Mandelbrot 集 的 全 彩 图 。 图 3-3 Mandelbrot 集 


练习 3.6 : 超 采 样 ( supersampling) 通过 对 几 个 临近 像素 颜色 值 取样 并 取 均 值 ， 是 一 种 


减少 锯齿 化 的 方法 。 最 简单 的 做 法 是 将 每 个 像素 分 成 4 个 “ 子 像素 ”。 给 出 实现 方式 。 


练习 3.7 : 男 一 种 简单 的 分 形 是 运用 牛顿 法 求 某 个 函数 的 复数 解 ， 比 如 z*-1=0。 以 平面 


上 各 点 作为 牛顿 法 的 起 始 ， 根 据 逼近 其 中 一 个 根 (共有 4 个 根 ) 所 需 的 迭代 次 数 对 该 点 设 定 


灰 度 。 再 根据 求 得 的 根 对 每 个 点 进行 全 彩 上 色 。 
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练习 3.8 : 生成 高 度 放大 的 分 形 需要 极 高 的 数学 精度 。 分 别 用 以 下 4 种 类 型 ( complex64、 
complex128 、big.Float 和 big.Rat) 表示 数据 实现 同一 个 分 形 (后 面 两 种 类 型 由 math/big 包 给 出 。 
big.Float 类 型 随意 选用 float32/float64 浮 点 数 ， 但 精度 有 限 ; big.Rat 类 型 使 用 无 限 精度 的 
有 理 数 。) 它们 在 计算 性 能 和 内 存 消 耗 上 相 比如 何 ? 放大 到 什么 程度 ， 泻 染 的 失真 变 得 可 见 ? 

练习 3.9 : 编写 一 个 Web 服务 器 ， 它 生成 分 形 并 将 图 像 数 据 写 人 客户 端 。 要 让 客户 端 得 
以 通过 HTTP 请 求 的 参数 指定 x、y 值 和 放大 系数 。 


3.4 布尔 值 


bool 型 的 值 或 布尔 值 (boolean) 只 有 两 种 可 能 : 真 (true) 和 假 (false)。if 和 for 语句 
里 的 条 件 就 是 布尔 值 ， 比 较 操作 符 (如 == 和 <) 也 能 得 出 布尔 值 结果 。 一 元 操作 符 (!1) 表示 
逻辑 取 反 ， 因 此 !true 就 是 false， 或 者 可 以 说 (!true==false)==true。 比 如 ， 考 虑 到 代码 风 
格 ， 布 尔 表 达 式 x==true 相对 宛 长 ， 我 们 总 是 简化 为 x。 

布尔 值 可 以 由 运算 符 &&(AND) 以 及 |1(oR) 组 合 运算 ， 这 可 能 引起 短路 行为 : 如 果 运 算 符 
左边 的 操作 数 已 经 能 直接 确定 总 体 结 果 ， 则 右边 的 操作 数 不 会 计算 在 内 ， 所 以 下 面 的 表达 式 
是 安全 的 : 


s != "" && s[0] == 'x' 


其 中 ， 如 果 作 用 于 空 字 符 串 ，s[e] 会 触发 宕 机 异常 。 
因为 奶 较 1 优先 级 更 高 ( 助 记 罕 门 : && 表示 催 辑 乘 法 ，|| 表示 逻辑 加 法 )， 所 以 如 下 
形式 的 条 件 无 须 加 圆 括号 : 
if 'a' «= c && c <= 'z" || 
A” <= € We <= 1 
'@0' <=c8&&crc= '9'{ 
// ...ASCII 字母 或 数字 


} 
布尔 值 无 法 隐 式 转换 成 数值 (如 0 或 1 )， 反 之 也 不 行 。 如 下 状况 下 就 有 必要 使 用 显 式 if; 
if 
上 之 汗 
} 


假如 转换 操作 常常 用 到 ， 就 值得 专门 为 此 写 个 函数 : 
// 如 果 b 为 真 ，btoi 返回 1; 如 果 b 为 假 ， 则 返回 6 
func btoi(b bool) int { 
if bf 
return 1 


return 6 


3 
反 向 转换 操作 过 于 简单 ， 无 须 专门 撰写 函数 ， 但 为 了 与 btoi 对 应 ， 这 里 还 是 给 出 其 代码 : 
// itob 报告 是否 为 非 零 什 
func itob(i int) bool { return i != 0 } 
3.5 字符 串 
字符 串 是 不 可 变 的 字 节 序列 ， 它 可 以 包含 任意 数据 ， 包 括 0 值 字 节 ， 但 主要 是 人 类 可 读 
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的 文本 。 习 惯 上 ,文本 字符 串 被 解读 成 按 UTF-8 编码 的 Unicode 码 点 (文字 符号 ) 序列 ， 稍 
后 将 细 究 相关 内 容 。 

内 置 的 len 函数 返回 字符 串 的 字 节 数 (并 非 文字 符号 的 数目 )， 下 标 访问 操作 s[i] 则 取 
得 第 i 个 字符 ,其 中 @<iclen(s)。 


s := "hello, world" 
fmt.Println(len(s)) /A 12 
fmt.Println(s[6]，s[7]) // "164 119" ('h' and 'w') 


试图 访问 许可 范围 以 外 的 字 节 会 触发 宕 机 异常 : 

c := s[len(s)] // 宕 机 : 下 标 越界 

字符 串 的 第 i 个 字 节 不 一 定 就 是 第 i 个 字符 ， 因 为 非 ASCII 字符 的 UTF-8 码 点 需要 两 个 
字 节 或 多 个 字 节 。 稍 后 将 讨论 如 何 使 用 字符 。 

子 串 生成 操作 s[i:j] 产生 一 个 新 字符 串 ， 内 容 取 自 原 字 符 串 的 字 节 ， 下 标 从 i ( 含 边界 
值 ) 开始 ， 直 到 j (不 含 边界 值 )。 结 果 的 大 小 是 j-i 个 字 节 。 


fmt.Println(s[6:5]) // "hello" 


再 次 强调 ， 若 下 标 越 界 ， 或 者 j 的 值 小 于 i， 将 触发 宕 机 异常 。 
操作 数 i 与 j 的 默认 值 分 别 是 。 (字符 串 起 始 位 置 ) 和 len(s) (字符 串 终止 位 置 )， 若 省 
略 i 或 j,， 或 两 者 ， 则 取 默 认 值 。 


fmt.Println(s[:5]) // "hello" 
fmt.Println(s[7:]) // "world" 
fmt.Println(s[:]) // "hello, world" 


加 号 (+) 运算 符 连接 两 个 字符 串 而 生成 一 个 新 字符 串 : 


fmt.Println("goodbye" + s[5:]) // “goodbye, world" 


字符 串 可 以 通过 比较 运算 符 做 比较 ， 如 == 和 <; 比较 运算 按 字 节 进 行 ， 结 果 服 从 本 身 的 
字典 排序 。 

尽管 肯定 可 以 将 新 值 赋予 字符 串 变 野 ， 但 是 字符 串 值 无 法 改变 : 字符 串 值 本 身 所 包含 的 
字 节 序列 永 不 可 变 。 要 在 一 个 字符 串 后 面 添加 另 一 个 字符 串 ， 可 以 这 样 编写 代码 : 
:= "left foot" 
", right foot" 

这 并 不 改变 s 原 有 的 字符 串 值 ， 只 是 将 += 语句 生成 的 新 字符 串 赋 予 s。 同 时 ，t 仍然 持 
有 旧 的 字符 串 值 。 


fmt.Println(s) // "left foot, right foot" 
fmt.Println(t) // "left foot" 


因为 字符 串 不 可 改变 ， 所 以 字符 串 内 部 的 数据 不 允许 修改 : 

s[8] = "'L' // 编译 错误 : s[8] 无 法 赋值 

不 可 变 意 味 着 两 个 字符 串 能 安全 地 共用 同一 段 底层 内 存 ， 使 得 复制 任何 长 度 字 符 串 的 开 
销 都 低廉 。 类 似 地 ， 字 符 串 s 及 其 子 串 (如 s[7:]) 可 以 安全 地 共用 数据 ， 因 此 子 串 生成 操作 
的 开销 低廉 。 这 两 种 情况 下 都 没有 分 配 新 内 存 。 图 3-4 展示 了 一 个 字符 串 及 其 两 个 子 字符 串 
的 内 存 布局 ， 它 们 共用 底层 字 节 数组 。 
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s := "hello, world" 
hello := s[:5] 
world := s[7:] 


图 3-4 字符 串 "hello,world" 及 其 两 个 子 字符 串 


3.5.1 字符 串 字面 量 | 
字符 串 的 值 可 以 直接 写成 字符 串 字 面 量 (string literal)， 形 式 上 就 是 带 双 引号 的 字 节 序列 : 
"Hello, 世界 " 


因为 Go 的 源 文件 总 是 按 UTF-8 编码 ， 并 且 习 惯 上 Go 的 字符 串 会 按 UTF-8 解读 ， 所 以 
在 源码 中 我 们 可 以 将 Unicode 码 点 写 人 字符 串 字 面 量 。 

在 带 双 引号 的 字符 串 字面 量 中 ， 转 义 序 列 以 反 斜 枉 (\) 开始 ， 可 以 将 任意 值 的 字 节 插入 
字符 串 中 。 下 面 是 一 组 转 义 符 ， 表 示 ASCII 控制 码 ， 如 换行 符 、 回 车 符 和 制 表 符 。 

\a “警告 ”或 响 铃 

\b 退 格 符 

\f ” 换 页 符 

\n ”换行 符 ( 指 直接 跳 到 下 一 行 的 同一 位 置 ) 

Ar ” 回 车 符 ( 指 返 回 行 首 ) 

\t 制 表 符 

\v “垂直 制 表 符 

\' 单 引号 ( 仅 用 于 文字 字符 字面 量 '\'') 

\"” 双 引 号 ( 仅 用 于 “…” 字 面 量 内 部 ) 

\\ 反 和 斜 杠 

源码 中 的 字符 串 也 可 以 包含 十 六 进 制 或 八进制 的 任意 字 节 。 十 六 进 制 的 转 义 字符 写成 
\xhh 的 形式 , h 是 十 六 进 制 数字 (大 小 写 丝 可 )， 且 必须 是 两 位 。 八 进 制 的 转 义 字符 写成 \o00 
的 形式 ， 必 须 使 用 三 位 八进制 数字 (0 一 7 )， 且 不 能 超过 \377。 这 两 者 都 表示 单个 字 节 ， 内 
容 是 给 定 值 。 后 面 ， 我 们 将 看 到 如 何 将 数值 形式 的 Unicode 码 点 艇 人 字符 串 字 面 量 。 

原生 的 字符 串 字面 量 的 书写 形式 是 `.….， 使 用 反 引 号 而 不 是 双 引 号 。 原 生 的 字符 串 字面 量 
内 ， 转 义 序列 不 起 作用 ; 实质 内 容 与 字面 写法 严格 一 致 ， 包 括 反 斜 杠 和 换行 符 ， 因 此 ， 在 程序 
源码 中 ， 原 生 的 字符 串 字面 量 可 以 展开 多 行 。 唯 一 的 特殊 处 理 是 回 车 符 会 被 删除 (换行 符 会 保 
留 )， 使 得 同一 字符 串 在 所 有 平台 上 的 值 都 有 相同 ， 包 括 习惯 在 文本 文件 存 人 换行 符 的 系统 。 

正则 表达 式 往往 含有 大 量 反 斜 枉 ， 可 以 方便 地 写成 原生 的 字符 串 字 面 量 。 原 生 的 字面 量 
也 适用 于 HTML 模板 、JSON 字面 量 、 命 令 行 提示 信息 ， 以 及 需要 多 行文 本 表达 的 场景 。 

const GoUsage = “Go is a tool for managing Go source code. 


Usage: 
go command [arguments] 


3.5.2 Unicode 
从 前 ， 事 情 简 单 明晰 ， 至 少 ， 狭 隘 地 看 ， 软 件 只 须 处 理 一 个 字符 集 : ASCII (美国 信息 
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交换 标准 码 )。ASCII (或 更 确切 地 说 ，US-ASCII) 码 使 用 7 位 表示 128 个 “字符 ”: 大 小 写 
英文 字母 、 数 字 、 各 种 标点 和 设备 控制 符 。 这 对 早期 的 计算 机 行业 已 经 足够 了 ， 但 是 让 世界 
上 众多 使 用 其 他 语言 的 人 无 法 在 计算 机 上 使 用 自己 的 文书 体系 。 随 着 互联 网 的 兴起 ， 包 含 纷 
繁 语言 的 数据 屡见不鲜 。 到 底 怎 样 才能 应 付 语 言 的 繁杂 多 样 ， 还 能 兼顾 高 效率 ? 

答案 是 Unicode (unicode.org)， 它 圳 括 了 世界 上 所 有 文书 体系 的 全 部 字符 ， 还 有 重音 符 
和 其 他 变 音 符 ， 控 制 码 (如 制 表 符 和 回 车 符 )， 以 及 许多 特有 文字 ， 对 它们 各 自 赋 予 一 个 叫 
Unicode 码 点 的 标准 数字 。 在 Go 的 术语 中 ， 这 些 字符 记号 称 为 文字 符号 (rune)。 

Unicode 第 8 版 定义 了 超过 一 百 种 语言 文字 的 12 万 个 字符 的 码 点 。 它 们 在 计算 机 程序 
和 数据 中 如 何 表 示 ? 天 然 适合 保存 单个 文字 符号 的 数据 类 型 就 是 int32， 为 Go 所 采用 ; 正 
因 如 此 ，rune 类 型 作为 int32 类 型 的 别名 。 

我 们 可 以 将 文字 符号 的 序列 表示 成 int32 值 序列 ， 这 种 表示 方式 称 作 UTF-32 或 UCS-4， 
每 个 Unicode 码 点 的 编码 长 度 相 同 ， 都 是 32 位 。 这 种 编码 简单 划一 ， 可 是 因为 大 多 数 面向 计 
算 机 的 可 读 文本 是 ASCII 码 ， 每 个 字符 只 需 8 位 ， 也 就 是 1 字 节 ， 导 致 了 不 必要 的 存储 空间 
消耗 。 而 使 用 广泛 的 字符 的 数目 也 少 于 65556 个 ， 字 符 用 16 位 就 能 容纳 。 我 们 能 作 改 进 吗 ? 


3.5.3 UTF-8 


UTF-8 以 字 节 为 单位 对 Unicode 码 点 作 变 长 编码 。UTF-8 是 现行 的 一 种 Unicode 标准 ， 
由 Go 的 两 位 创建 者 Ken Thompson 和 Rob Pike 发 明 。 每 个 文字 符号 用 1 ~ 4 个 字 节 表示 ， 
ASCII 字符 的 编码 仅 占 1 个 字 节 ， 而 其 他 常用 的 文书 字符 的 编码 只 是 2 或 3 个 字 节 。 一 个 文 
字符 号 编码 的 首 字 节 的 高 位 指明 了 后 面 还 有 多 少 字 节 。 若 最 高 位 为 0， 则 标示 着 它 是 7 位 的 
ASCII 码 ， 其 文字 符号 的 编码 仅 占 1 字 节 ， 这 样 就 与 传统 的 ASCII 码 一 致 。 若 最 高 几 位 是 
116， 则 文字 符号 的 编码 占用 2 个 字 节 ， 第 二 个 字 节 以 1e 开始 。 更 长 的 编码 以 此 类 推 。 


XXXXXXX 文字 符号 6 ~ 127 (ASCII) 

116XxxXXX 106xxxxxx 128 ~ 2647 少 于 128 个 未 使 用 的 值 
1110xxxx 16XxXxXXXXx 106xxxxxx 2648 ~ 65535 少 于 2048 个 未 使 用 的 值 
11116xxx 10xxxxxx 106xxxxxx 16xxxxxx 65536 ~ @x16ffff 其 他 未 使 用 的 值 


变 长 编码 的 字符 串 无 法 按 下 标 直 接 访问 第 n 个 字符 ,然而 有 失 有 得 ，UTF-8 换 来 许多 有 
用 的 特性 。UTF-8 编码 紧凑 ， 兼 容 ASCII， 并 且 自 同步 : 最 多 追溯 3 字 节 ， 就 能 定位 一 个 字 
符 的 起 始 位 置 。UTF-8 还 是 前 绥 编 码 ， 因 此 它 能 从 左 向 右 解码 而 不 产生 歧义 ， 也 无 须 超 前 预 
读 。 于 是 查找 文字 符号 仅 须 搜索 它 自身 的 字 节 ， 不 必 考 虑 前 文 内 容 。 文 字符 号 的 字典 字 节 顺 
序 与 Unicode 码 点 顺序 一 致 (Unicode 设计 如 此 )， 因 此 按 UTF-8 编码 排序 自然 就 是 对 文字 符 
号 排序 。UTF-8 编码 本 身 不 会 庶 人 NUL 字 节 (0 值 )， 这 便于 某 些 程序 语言 用 NUL 标记 字 
符 串 结尾 。 

Go 的 源 文件 总 是 以 UTF-8 编码 ， 同 时 ， 需 要 用 Go 程序 操作 的 文本 字符 串 也 优先 采用 
UTF-8 编码 。unicode 包 具 备 针对 单个 文字 符号 的 函数 (例如 区 分 字母 和 数字 ， 转 换 大 小 写 )， 
而 unicode/utf8 包 则 提供 了 按 UTF-8 编码 和 解码 文字 符号 的 函数 。 

许多 Unicode 字符 难以 直接 从 键盘 输入 ; 有 的 看 起 来 十 分 相似 几乎 无 法 分 辨 ， 有 些 甚至 
不 可 见 。Go 语言 中 ,字符 串 字面 量 的 转 义 让 我 们 得 以 用 码 点 的 值 来 指明 Unicode 字符 。 有 
两 种 形式 ，\uhhhh 表示 16 位 码 点 值 ，\uhhhhhhhh 表示 32 位 码 点 值 ， 其 中 每 个 有 代表 一 个 
十 六 进 制 数 字 ; 32 位 形式 的 码 点 值 几乎 不 需要 用 到 。 这 两 种 形式 都 以 UTF-8 编码 表示 出 给 
定 的 码 点 。 因 此 ， 下 面 几 个 字符 串 字 面 量 都 表示 长 度 为 6 字 节 的 相同 串 : 
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"世界 " 
"\xe4\xb8\x96\xe7\x95\x8c" 
"\u4e16\u754c" 
”\U6866684e16\U86688754c"” 


后 面 三 行 的 转 义 序列 用 不 同形 式 表示 第 一 行 的 字符 串 ， 但 实质 上 它们 的 字符 串 值 都 
一 样 。 
Unicode 转 义 符 也 能 用 于 文字 符号 。 下 列 字 符 是 等 价 的 : 


' 世 '" '\u4e16' “\U66664e16 


码 点 值 小 于 256 的 文字 符号 可 以 写成 单个 十 六 进 制 数 转 义 的 形式 ， 如 'a' 写成 '\x41'， 
而 更 高 的 码 点 值 则 必须 使 用 \u 或 \u 转 义 。 这 就 导致 ，'\xe4\xb8\x96' 不 是 合法 的 文字 符号 ， 
虽然 这 三 个 字 节 构成 某 个 有 效 的 UTF-8 编码 码 点 。 

由 于 UTF-8 的 优良 特性 ， 许 多 字符 串 操 作 都 无 须 解码 。 我 们 可 以 直接 判断 某 个 字符 串 
是 否 为 男 一 个 的 前 级 : 


func Hasprefix(s, prefix string) bool { 
return len(s) >= len(prefix) && s[:len(prefix)] == prefix 


} 
或 者 它 是 否 为 男 一 个 字符 串 的 后 缀 : 


func HasSuffix(s, suffix string) bool { 
return len(s) >= len(suffix) && s[len(s)-len(suffix):] == suffix 
} 


或 者 它 是 否 为 另 一 个 的 子 字符 串 : 


func Contains(s, substr string) bool { 
for i := 6; i < len(s); i++ { 
if HasPprefix(s[i:], substr) { 
return true 


} 


return false 

} 

按 UTF-8 编码 的 文本 的 逻辑 同样 也 适用 原生 字 节 序列 ,但 其 他 编码 则 无 法 如 此 。( 上 面 
的 函数 取 自 strings 包 ， 其 实 contains 函数 的 具体 实现 使 用 了 散 列 方法 让 搜索 更 高 效 。) 

另 一 方面 ， 如 果 我 们 真 的 要 逐个 逐个 处 理 Unicode 字符 ， 则 必须 使 用 其 他 编码 机 制 。 考 
虑 我 们 第 一 个 例子 的 字符 串 ( 见 3.5.1 节 )， 它 包含 两 个 东亚 字符 。 图 3-5 说 明了 该 字符 串 的 
内 存 布局 。 它 含有 13 个 字 节 ， 而 按 作 UTF-8 解读 ， 本 质 是 9 个 码 点 或 文字 符号 的 编码 : 

import "unicode/utf8" 

Ss := "Hello， 世 界 " 


fmt.Println(len(s)) pd 
fmt.Println(utf8.RuneCountInstring(s)) // "9" 


我 们 需要 UTF-8 解码 器 来 处 理 这 些 字符 ，unicode/utf8 包 就 具备 一 个 : 


for i := 60; i < len(s); { 


r, size := utf8.DecodeRuneInString(s[i:]) 
fmt.Printf("%d\t%c\n", i, r) 
i += size 
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每 次 DecodeRuneInstring 的 调用 都 返回 r (文字 符号 本 身 ) 和 一 个 值 (表示 " 按 UTF-8 编 
码 所 占用 的 字 节 数 )。 这 个 值 用 来 更 新 下 标 i1， 定 位 字符 串 内 的 下 一 个 文字 符号 。 可 是 按 此 
方法 ， 我 们 总 是 需要 使 用 上 例 中 的 循环 形式 。 所 幸 ，Go 的 range 循环 也 适用 于 字符 串 ， 按 
UTF-8 隐 式 解码 。 图 3-5 也 展示 了 以 下 循环 的 输出 。 注 意 ， 对 于 非 ASCII 文字 符号 ， 下 标 增 
量 大 于 1。 






UTF-8 编码 


rn 


111 
44 
32 

' 世 ' 19996 

9 ' 界 ' 36628 


图 3-5 一 个 按 UTF-8 编码 的 字符 串 在 range 循环 内 解码 
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for i,，r := range "Hello， 世 界 " { 
fmt.Printf("%d\t%q\t%d\n", i, r, r) 


PNUNOUNMUPAUWUNOPOF. 


} 


for i, r := range "Hello, 世界 " { 
fmt.Printf("%d\t%q\t%d\n", i, r, r) 


我 们 可 用 简单 的 range 循环 统计 字符 串 中 的 文字 符号 数目 ， 如 下 所 示 : 


n := 6 
for ，_ = range 5 1{ 
与 其 他 形式 的 range 循环 一 样 ， 可 以 忽略 没 用 的 变量 : 
n := 6 
for range s { 
n++ 
} 


或 者 ， 直 截 了 当地 调用 utf8.RuneCountInstring(s)。 

之 前 提 到 过 ， 文 本 字符 串 作为 按 UTF-8 编码 的 Unicode 码 点 序列 解读 ， 很 大 程度 是 出 
于 习惯 ， 但 为 了 确保 使 用 range 循环 能 正确 处 理 字 符 串 ， 则 必须 要 求 而 不 仅仅 是 按照 习惯 。 
如 果 字 符 串 含有 任意 二 进 制 数 ， 也 就 是 说 ，UTF-8 数据 出 错 ， 而 我 们 对 它 做 range 循环 ， 会 
发 生 什么 ? 

每 次 UTF-8 解码 器 读 入 一 个 不 合理 的 字 节 ， 无 论 是 显 式 调用 utf8.DecodeRuneInstring， 
还 是 在 range 循环 内 隐 式 读 取 ， 都 会 产生 一 个 专门 的 Unicode 字符 '\uFFFD' 替换 它 ， 其 输出 
通常 是 个 黑色 六 角形 或 类 似 钻石 的 形状 ， 里 面 有 个 白色 问号 。 如 果 程 序 碰 到 这 个 文字 符号 
值 ， 通 常 意味 着 ， 生 成 字符 串 数据 的 系统 上 游 部 分 在 处 理 文本 编码 方面 存在 瑕 疫 。 

UTF-8 是 一 种 分 外 便捷 的 交互 格式 ， 而 在 程序 内 部 使 用 文字 字符 类 型 可 能 更 加 方便 ， 因 


礁 杰 数据 53 
a 


为 它们 大 小 一 致 ， 便 于 在 数组 和 slice 中 用 下 标 访问 。 
当 []rune 转换 作用 于 UTF-8 编码 的 字符 串 时 ， 返 回 该 字符 串 的 Unicode 码 点 序列 


// 日 语 片 假名 "程序" 

5 := "FOY53A" 

fmt.Printf("% x\n", s) // "e3 83 97 e3 83 ad e3 82 bg e3 83 a9 e3 83 a6" 
r := [J]rune(s) 

fmt.Printf("%x\n", r) // "[38d7 36ed 36b8 36e9 36e8]" 


(第 一 个 Printf 里 的 谓词 jx (注意 ,，% 和 x 之 间 有 空格 ) 以 十 六 进 制 数 形式 输出 ， 并 在 每 
两 个 数位 间 插 入 空格 。) 

如 果 把 文字 符号 类 型 的 slice 转换 成 一 个 字符 串 ， 它 会 输出 各 个 文字 符号 的 UTF-8 编码 
拼接 结果 : 

fmt.Println(string(r)) // "F0253A" 

右 将 一 个 整数 值 转换 成 字符 串 ， 其 值 按 文字 符号 类 型 解读 ， 并 且 产 生 代表 该 文字 符号 值 
的 UTF-8 码 : 


fmt.Println(string(65)) //“"A", 而 不 是 "65" 
fmt.Println(string(9x4eac)) //“" 京 " 


如 果 文 字符 号 值 非法 ， 将 被 专门 的 替换 字符 取代 ( 见 前 面 的 '\uFFFD' )。 


fmt.Println(string(1234567)) // "8@" 


3.5.4 字符 串 和 字 节 slice 


4 个 标准 包 对 字符 串 操作 特别 重要 : bytes 、strings、 strconv 和 unicode。 

strings 包 提供 了 许多 函数 ， 用 于 搜索 、 替 换 、 比 较 、 修 整 、 切 分 与 连接 字符 串 。 

bytes 包 也 有 类 似 的 函数 ， 用 于 操作 字 节 slice([]byte 类 型 ， 其 某 些 属 性 和 字符 串 相 同 )。 
由 于 字符 串 不 可 变 ， 因 此 按 增 量 方式 构建 字符 串 会 导致 多 次 内 存 分 配 和 复制 。 这 种 情况 下 ， 
使 用 bytes,Buffer 类 型 会 更 高 效 ， 范 例 见 后 。 

strconv 包 具备 的 函数 ， 主 要 用 于 转换 布尔 值 、 整 数 、 浮 点 数 为 与 之 对 应 的 字符 串 形 
式 ， 或 者 把 字符 串 转换 为 布尔 值 、 整 数 、 浮 点 数 ， 另 外 还 有 为 字符 串 添 加 /去 除 引 号 的 
函数 。 
unicode 包 备 有 判别 文字 符号 值 特性 的 函数 ， 如 IsDigit、IsLetter、 IsUpper 和 IsLower。 
每 个 函数 以 单个 文字 符号 值 作为 参数 ， 并 返回 布尔 值 。 若 文字 符号 值 是 英文 字母 ， 转 换 函 数 
(如 Toupper 和 ToLower) 将 其 转换 成 指定 的 大 小 写 。 上 面 所 有 函数 都 遵循 Unicode 标准 对 字 
母 数字 等 的 分 类 原则 。strings 包 也 有 类 似 的 函数 ， 函 数 名 也 是 Toupper 和 ToLower， 它 们 对 
原 字 符 串 的 每 个 字符 做 指定 变换 ， 生 成 并 返回 一 个 新 字符 串 。 

下 例 中 ，basename 函数 模仿 UNIX shell 中 的 同名 实用 程序 。 只 要 s 的 前 级 看 起 来 像 是 文 
件 系统 路 径 (各 部 分 由 斜 杠 分 隔 )， 该 版 本 的 basename(s) 就 将 其 移 除 ， 貌 似 文件 类 型 的 后 缀 
也 被 移 除 : 


fmt,.Println(basename("a/b/c.go")) // "c" 
fmt.Println(basename("c.d.g0")) // "c.d" 
fmt.Println(basename("abc")) // "abc" 


初版 的 basename 独自 完成 全 部 工作 ， 并 不 依赖 任何 库 : 
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gopl1.io/ch3/basename1 
// basename 移 除 路 径 部 分 和 . 后 级 


// e.g.，a => a，a.go => a，a/b/c.go => ¢, a/b.c.g0 => be 
func basename(s string) string { 
// 将 最 后 一 个 '/' 和 之 前 的 部 分 全 都 舍弃 
for i := len(s) - 1; i >= 0@; i-- { 
if s[i] == '/" { 
ss S[ir1:] 
break 





} 


} 
// 保留 最 后 一 个 '." 之 前 的 所 有 内 容 
for i := len(s) - 1; i >= 60; i-- { 


if s[i] == '"." { 
s = S[:1] 
break 
} 
} 
return s 


} 
简化 版 利用 库 函 数 string.LastIndex: 


gop1. io/ch3/basename2 
func basename(s string) string { 
slash := strings.LastIndex(s,，"/") // 如 果 没 找到 "/"， 则 slash 取 值 -1 
s = s[slash+1:] 
if dot := strings.LastIndex(s, "."); dot >= 0 1{ 
s= s[:dot] 
} 


return s 


} 

path 包 和 path/filapath 包 提供 了 一 组 更 加 普遍 适用 的 函数 ， 用 来 操作 文件 路 径 等 具有 
层次 结构 的 名 字 。path 包 处 理 以 斜 杠 / 分 段 的 路 径 字 符 串 ， 不 分 平台 。 它 不 适合 用 于 处 理 文 
件 名 ， 却 适合 其 他 领域 ， 像 URL 地 址 的 路 径 部 分 。 相 反 地 ，path/filepath 包 根 据 宿主 平台 
(host platform) 的 规则 处 理 文件 名 ， 例 如 POSIX 系统 使 用 /foo/bar， 而 Microsoft Windows 
系统 使 用 c:\foo\bar。 

我 们 继续 看 另 一 个 例子 ， 它 涉及 子 字 符 串 操作 。 任 务 是 接受 一 个 表示 整数 的 字符 串 ， 如 
"12345"， 从 右 侧 开始 每 三 位 数字 后 面 就 插入 一 个 逗号 ， 形 如 "12,345"。 这 个 版 本 仅 对 整数 有 
效 。 对 浮 点 数 的 处 理 方 式 留 作 练习 。 


8&opl.io/ch3/comma 
// 函数 向 表示 十 进 制 非 负 整数 的 字符 串 中 插入 逗号 


func comma(s string) string { 


n := len(s) 
if n <= 31 
return s 


return comma(s[:n-3]) + "," + s[n-3:] 


} 

comma 函数 的 参数 是 一 个 字符 串 。 若 字符 串 长 度 小 于 等 于 3， 则 不 插入 逗号 。 否 则 ， 
comma 以 仅 包含 字符 串 最 后 三 个 字符 的 子 字符 串 作 为 参数 ， 递 归 调 用 自己 ， 最 后 在 递归 调用 
的 结果 后 面 添加 一 个 逗号 和 最 后 三 个 字符 。 

若 字符 串 包含 一 个 字 节 数组 ， 创 建 后 它 就 无 法 改变 。 相 反 地 ， 字 节 slice 的 元 素 允 许 随 
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意 修改 。 
字符 串 可 以 和 字 节 slice 相互 转换 : 
s "abc”" 


b [Jbyte(s) 
s2 := string(b) 


概念 上 ，[]byte(s) 转换 操作 会 分 配 新 的 字 节 数组 ， 拷 贝 填 人 s 含有 的 字 节 ， 并 生成 一 
个 slice 引用 ， 指 向 整个 数组 。 具 备 优化 功能 的 编译 器 在 某 些 情 况 下 可 能 会 避免 分 配 内 存 和 
复制 内 容 ， 但 一 般 而 言 ， 复 制 有 必要 确保 s 的 字 节 维持 不 变 (即使 b 的 字 节 在 转换 后 发 生 改 
变 )。 反 之 ,用 string(b) 将 字 节 slice 转换 成 字符 串 也 会 产生 一 份 副本 ， 保 证 sz 也 不 可 变 。 

为 了 避免 转换 和 不 必要 的 内 存 分 配 ，bytes 包 和 strings 包 都 预备 了 许多 对 应 的 实用 函数 
(utility function)， 它 们 两 两 相对 应 。 例 如 ，strings 包 具备 下 面 6 个 函数 : 


func Contains(s, substr string) bool 
func Count(s, sep string) int 

func Fields(s string) []string 

func Hasprefix(s, prefix string) bool 
func Index(s, sep string) int 

func Join(a []string, sep string) string 


bytes 包 里 面 的 对 应 函数 为 : 


func Contains(b, subslice []byte) bool 
func Count(s, sep [J]byte) int 

func Fields(s []byte) [][]byte 

func Hasprefix(s, prefix []byte) bool 
func Index(s, sep []byte) int 

func Join(s [][]Jbyte, sep []byte) []byte 


唯一 的 不 同 是 ， 操 作对 象 由 字符 串 变 为 字 节 slice。 

bytes 包 为 高 效 处 理 字 节 slice 提供 了 Buffer 类 型 。Buffer 起 初 为 空 ， 其 大 小 随 着 各 种 类 
型 数据 的 写 人 而 增长 ， 如 string、byte 和 []byte。 如 下 例 所 示 ,bytes.Buffer 变量 无 须 初始 化 ， 
原因 是 零 值 本 来 就 有 效 : 


8&opJ.io/ch3avprintints 

// intsToSstring 与 fmt.Sprint(values) 类 似 ， 但 插入 了 逗号 
func intsToSstring(values []int) string { 

var buf bytes.Buffer 

buf .WriteByte('[') 

for i, v := range values { 

二 竺 
buf.Writestring(", ") 


中 站 





} 
fmt.Fprintf(&buf, "%d", v) 


buf .WriteByte(']') 
return buf.String() 
} 


func main() { 
fmt.Println(intsTostring([]int{1, 2, 3 /yy "Ts 25 3 
$ 


若 要 在 bytes.Buffer 变量 后 面 添 加 任意 文字 符号 的 UTF-8 编码 ， 最 好 使 用 bytes .Buffer 
的 writeRune 方法 ， 而 追加 ASCII 字符 ， 如 '[' 和 ']'， 则 使 用 writeByte 亦 可 。 
bytes.Buffer 类 型 用 途 极 广 ， 在 第 7 章 讨论 接口 的 时 候 ， 假 若 IO 函数 需要 一 个 字 节 接 
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收 器 (io.writer) 或 字 节 发 生 器 (io.Reader)， 我 们 将 看 到 能 如 何 用 其 来 代替 文件 ， 其 中 接收 
器 的 作用 就 如 上 例 中 的 Fprintf 一 样 。 
练习 3.10 : 编写 一 个 非 递归 的 comma 函数 ， 运 用 bytes.Buffer， 而 不 是 简单 的 字符 串 


拼接 。 
练习 3.11 : 增强 comma 函数 的 功能 ， 让 其 正确 处 理 浮 点 数 ， 以 及 带 有 可 选 正 负 号 的 
数字 。 


练习 3.12 : 编写 一 个 函数 判断 两 个 字符 串 是 否 同文 异 构 ， 也 就 是 ， 它 们 都 含有 相同 的 
字符 但 排列 顺序 不 同 。 


3.5.5 字符 串 和 数字 的 相互 转换 

除了 字符 串 、 文 字符 号 和 字 节 之 间 的 转换 ， 我 们 常常 也 需要 相互 转换 数值 及 其 字符 串 表 
示 形 式 。 这 由 strconv 包 的 函数 完成 。 

要 将 整数 转换 成 字符 串 ， 一 种 选择 是 使 用 fmt.sprintf， 另 一 种 做 法 是 用 函数 strconv. 
Itoa (“integer to ASCII”): 


x := 123 
y := fmt.Sprintf("%d", x) 
fmt.Println(y, strconv.Itoa(x)) // "123 123" 


FormatInt 和 FormatUint 可 以 按 不 同 的 进位 制 格 式 化 数字 : 

fmt.Println(strconv.FormatInt(int64(x), 2)) // "1111811" 

fmt.printf 里 的 谓词 %%、%d、%o 和 %x 往往 比 Format 函数 方便 ， 若 要 包含 数字 以 外 的 附 
加 信息 ， 它 就 尤其 有 用 : 

s := fmt.Sprintf("x=%b", x) // "x=1111811" 


strconv 包 内 的 Atoi 函数 或 ParseInt 函数 用 于 解释 表示 整数 的 字符 串 ， 而 Parseuint 用 
于 无 符号 整数 : 


x, err := strconv.Atoi("123") // x 是 整 型 
y，err := strconv.ParseInt("123"，16，64) // 十 进 制 ， 最 长 为 64 位 


parseInt 的 第 三 个 参数 指定 结果 必须 匹配 何 种 大 小 的 整 型 ， 例如，16 表示 int16， 而 
0 作为 特殊 值 表示 int。 任 何 情况 下 ， 结 果 y 的 类 型 总 是 int64， 可 将 他 另外 转换 成 较 小 的 
类 型 。 

有 时 候 ， 单 行 输入 由 字符 串 和 数字 依次 混合 构成 ， 需 要 用 fmt.scanf 解释 ， 可 惜 fmt. 
scanf 也 许 不 够 灵活 ， 处 理 不 完整 或 不 规则 输入 时 尤其 。 


3.6 常量 

常量 是 一 种 表达 式 ， 其 可 以 保证 在 编译 阶段 就 计算 出 表达 式 的 值 ， 并 不 需要 等 到 运行 时 ， 
从 而 使 编译 器 得 以 知晓 其 值 。 所 有 常量 本 质 上 都 属于 基本 类 型 : 布尔 型 、 字 符 串 或 数字 。 

常量 的 声明 定义 了 具名 的 值 ， 它 看 起 来 在 语法 上 与 变量 类 似 ， 但 该 值 恒定 ， 这 防止 了 程 
序 运行 过 程 中 的 意外 (或 恶意 ) 修改 。 例 如 ， 要 表示 数学 常量 ， 像 圆周 率 ， 在 Go 程序 中 用 
常量 比 变量 更 适合 ， 因 其 值 恒定 不 变 : 

const pi = 3.14159 // 近似 数 ; math.Pi 是 更 精准 的 近似 
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与 变量 类 似 ， 同 一 个 声明 可 以 定义 一 系列 常量 ， 这 适用 于 一 组 相关 的 值 : 


const ( 
e = 2.71828182845964523536628747135266249775724769369995957496696763 
Bi 三 3.141592653589793238462643383279562884197169399375168582697494459 
) 


许多 针对 常量 的 计算 完全 可 以 在 编译 时 就 完成 ， 以 减免 运行 时 的 工作 量 并 让 其 他 编译 器 
优化 得 以 实现 。 某 些 错误 通常 要 在 运行 时 才能 检测 到 ， 但 如 果 操 作 数 是 常量 ， 编 译 时 就 会 报 
错 ， 例 如 整数 除 以 0， 字符 串 下 标 越界 ， 以 及 任何 产生 无 限 大 值 的 浮 点 数 运 算 。 

对 于 常量 操作 数 ， 所 有 数学 运算 、 逻 辑 运算 和 比较 运算 的 结果 依然 是 常量 ， 常 量 的 类 型 
转换 结果 和 某 些 内 置 函 数 的 返回 值 ， 例 如 len 、cap 、real、 imag 、complex 和 unsafe.Sizeof， 
同样 是 常量 。 

因为 编译 器 知晓 其 值 ， 常 量 表 达 式 可 以 出 现在 涉及 类 型 的 声明 中 ， 具 体 而 言 就 是 数组 类 
型 的 长 度 : 

const IPv4Len = 4 


// parseIPv4 函数 解释 一 个 IPv4 地址 (d.d.d.d) 
func parseIPv4(s string) IP { 

var p [IPv4Len]byte 

A se 
} 


常量 声明 可 以 同时 指定 类 型 和 值 ， 如 果 没 有 显 式 指定 类 型 ， 则 类 型 根据 右边 的 表达 式 
推断 。 下 例 中 ，time.Duration 是 一 种 具名 类 型 ， 其 基本 类 型 是 int64，time.Minute 也 是 基于 
int64 的 常量 。 下 面 声明 的 两 个 常量 都 属于 time.Duration 类 型 ， 通 过 %T 展示 : 


const noDelay time.Duration = 6 

const timeout = 5 * 七 ime.Minute 

fmt.Printf("%T %[1]v\n", noDelay) // "time.Duration 6" 
fmt.Printf("%T %[1]v\n", timeout) // "time.Duration 5m6s" 
fmt.Printf("%T %[1]v\n", time.Minute) // "time.Duration 1mes" 


奉 同时 声明 一 组 常量 ， 除 了 第 一 项 之 外 ， 其 他 项 在 等 号 右 侧 的 表达 式 都 可 以 省 略 ， 这 意 
味 着 会 复 用 前 面 一 项 的 表达 式 及 其 类 型 。 例 如 : 


const ( 
a=1 
b 
c=2 
d 


fmtaprintln(Cas by t UY J/ "LT 1 2 2 


如 果 复 用 右 侧 表达 式 导 致 计算 结果 总 是 相同 ， 这 就 并 不 太 实用 。 假 若 该 结果 可 变 该 怎么 
办 呢 ? 我 们 来 看 看 iota。 


3.6.1 常量 生成 器 iota 


常量 的 声明 可 以 使 用 常量 生成 器 iota， 它 创建 一 系列 相关 值 ， 而 不 是 逐个 值 显 式 写 出 。 
常量 声明 中 ，iota 从 0 开始 取 值 ， 逐 项 加 1。 

下 例 取 自 time 包 ， 它 定义 了 weekday 的 具名 类 型 ， 并 声明 每 周 的 7 天 为 该 类 型 的 常量 ， 
从 sunday 开始 ， 其 值 为 0。 这 种 类 型 通常 称 为 枚 举 型 (enumeration， 或 缩写 成 enum ) 。 
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type Weekday int 


const ( 


) 


上 面 的 声明 中 ， 


Sunday Weekday = 
Monday 
Tuesday 
Wednesday 
Thursday 


Friday 


Saturday 


sunday 的 值 为 0，Monday 的 值 为 1， 以 此 类 推 。 


更 复杂 的 表达 式 也 可 使 用 iota， 借 用 net 包 的 代码 举例 如 下 ， 无 符号 整数 最 低 5 位 数 中 
的 每 一 个 都 逐一 命名 ， 并 解释 为 布尔 值 。 


type Flags uint 


const ( 


) 


FlagUp Flags 
FlagBroadcast 
FlagLoopback 
FlagPointToPoint 
FlagMulticast 


1 << iota // 向 上 


// 支持 广播 访问 

// 是 环 回 接口 

// 属于 点 对 点 链 路 
// 支持 多 路 广播 访问 


随 着 iota 递增 ， 每 个 常量 都 按 1<<iota 赋值 ， 这 等 价 于 2 的 连续 次 宕 ， 它 们 分 别 与 单个 
位 对 应 。 若 某 些 函 数 要 针对 相应 的 位 执行 判定 、 设 置 或 清除 操作 ， 就 会 用 到 这 些 常量 。 


gopl1.io/ch3/netflag 
func IsUp(v Flags) bool 
func TurnDown(v *Flags) 
func SetBroadcast(v *Flags) 
func IsCast(v Flags) bool 
func main() { 
var v Flags 
fmt.Printf("%b %t\n", 
TurnDown(&v) 
fmt .Printf("%b %t\n", 
SetBroadcast(&v) 
fmt.Printf("%b %t\n", 
fmt.Printf("%b %t\n", 


} 


下 例 更 复杂 ， 


const ( 


) 


KiB 
MiB 
GiB 
TiB 
PiB 
EiB 
ZiB 
YiB 


1 << (16 * iota) 


// 
// 
// 
// 
// 
// 
// 
// 


1125899966842624 

1152921564666846976 
1186591626717411363424 (超过 1 << 64) 
1268925819614629174766176 


return v&FlagUp == FlagUp } 

*V &^= FlagUp } 

*V |= FlagBroadcast } 

return v&(FlagBroadcast|FlagMulticast) !I= 86】} 


FlagMulticast | FlagUp 
v, IsUp(v)) // "18661 true" 


v, IsUp(v)) // “16666 false" 


v, IsUp(v)) // "16616 false" 
v, IsCast(v)) // “168616 true" 


声明 的 常量 表示 1024 的 知 。 


(超过 1 << 32) 


iota 机 制 存 在 局 限 。 比 如 ， 因 为 不 存在 指数 运算 符 ， 所 以 无 从 生成 更 为 人 熟知 的 
1000 的 宕 (KB、MB 等 )。 
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练习 3.13: 用 尽 可 能 简洁 的 方法 声明 从 KB 、MB 直到 YB 的 常量 。 


3.6.2 无 类 型 常量 


Go 的 常量 自 有 特别 之 处 。 虽 然 常量 可 以 是 任何 基本 数据 类 型 ， 如 int 或 float64， 也 包 
括 具名 的 基本 类 型 (如 time.puration)， 但 是 许多 常量 并 不 从 属 某 一 具体 类 型 。 编 译 器 将 这 
些 从 属 类 型 待定 的 常量 表示 成 某 些 值 ， 这 些 值 比 基 本 类 型 的 数字 精度 更 高 ， 且 算术 精度 高 于 
原生 的 机 器 精度 。 可 以 认为 它们 的 精度 至 少 达到 256 位 。 从 属 类 型 待定 的 常量 共有 6 种 ， 分 
别 是 无 类 型 布尔 、 无 类 型 整数 、 无 类 型 文字 符号 、 无 类 型 浮 点 数 、 无 类 型 复数 、 无 类 型 字 

借助 推迟 确定 从 属 类 型 ， 无 类 型 常量 不 仅 能 暂时 维持 更 高 的 精度 ， 与 类 型 已 确定 的 常量 
相 比 ， 它 们 还 能 写 进 更 多 表达 式 而 无 需 转换 类 型 。 比 如 ， 上 例 中 zie 和 Yie 的 值 过 大 ， 用 哪 
种 整 型 都 无 法 存储 ， 但 它们 都 是 合法 常量 并 且 可 以 用 在 下 面 的 表达 式 中 : 


fmt.Println(YiB/ZiB) // "1624" 


再 例如 ， 浮 点 型 常量 math.Pi 可 用 于 任何 需要 浮 点 值 或 复数 的 地 方 : 


var x float32 = math.Pi 
var y float64 = math.Pi 
var z complex128 = math.Pi 


若 常量 math.Pi 一 开始 就 确定 从 属于 某 具 体 类 型 ， 如 float64， 就 会 导致 结果 的 精度 下 
降 。 另 外 ， 假 使 最 终 需 要 float32 值 或 complex128 值 ， 则 可 能 需要 转换 类 型 

Const Pi64 float64 = math.Pi 

var x float32 = float32(Pi64) 


var y float64 = Pi64 
var z complex128 = complex128(Pi64) 


字面 量 的 类 型 由 语法 决定 。6。、e6.6、ei 和 '\ueeee' 全 都 表示 相同 的 常量 值 ， 但 类 型 相 
异 ， 分 别 是 : 无 类 型 整数 、 无 类 型 浮 点 数 、 无 类 型 复数 和 无 类 型 文字 符号 。 类 似 地 ，true 和 
false 是 无 类 型 布尔 值 ， 而 字符 串 字面 量 则 是 无 类 型 字符 串 。 

根据 除法 运算 中 操作 数 的 类 型 ， 除 法 运算 的 结果 可 能 是 整 型 或 浮 点 型 。 所 以 ， 常 量 除法 
表达 式 中 ， 操 作 数 选择 不 同 的 字面 写法 会 影响 结果 : 


var f float64 = 212 

fmt.Println((f - 32) * 5 / 9) // "166"; (f - 32) * 5 的 结果 是 float64 型 
fmt.Println(5 / 9 * (f - 32)) // "6"; ”5/9 的 结果 是 无 类 型 整数 ，6 
fmt.Println(5.6 / 9.0 * (f - 32)) // "166"; 5.6/9.8 的 结果 是 无 类 型 浮 点 数 


只 有 常量 才 可 以 是 无 类 型 的 。 若 将 无 类 型 常量 声明 为 变量 (如 下 面 的 第 一 条 语句 所 示 )， 
或 在 类 型 明确 的 变量 赋值 的 右 方 出 现 无 类 型 常量 (如 下 面 的 其 他 三 条 语句 所 示 )， 则 常量 会 
被 隐 式 转换 成 该 变量 的 类 型 。 


var f float64 = 3 + 8i // 无 类 型 复数 -> float64 


f=2 // 无 类 型 整数 -> float64 
f = le123 // 无 类 型 浮 点 数 -> float64 
f='a’' // 无 类 型 -> float64 


上 述 语句 与 下 面 的 语句 等 价 : 
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var f float64 = float64(3 + 6i) 

f = float64(2) 

f = float64(1e123) 

f = float64("'a') 

不 论 隐 式 或 显 式 ， 常 量 从 一 种 类 型 转换 成 另 一 种 ， 都 要 求 目 标 类 型 能 够 表示 原 值 。 实 数 
和 复数 允许 舍 人 取 整 : 


t (人 ; 
a = 6xdeadbeef // 无 类 型 整数 ， 值 为 3735928559 
a = uint32(deadbeef) // uint32， 值 为 3735928559 
b = float32(deadbeef) // float32， 值 为 3735928576 (向 上 取 整 ) 
c = float64(deadbeef) // float64， 值 为 3735928559 (精确 值 ) 
d = int32(deadbeef)  // 编译 错误 : 溢出 ， int32 无 法 容纳 常量 值 
e = float64(1e369) // 编译 错误 : 溢出 ， float64 无 法 容纳 常量 值 
f = uint(-1) // 编译 错误 : 溢出 ， uint 无 法 容纳 常量 值 
) 
变量 声明 (包括 短 变量 声明 ) 中 ， 假 如 没有 显 式 指定 类 型 ， 无 类 型 常量 会 隐 式 转换 成 该 
变量 的 默认 类 型 ， 如 下 例 所 示 : 
i 9 // 无 类 型 整数 ; 隐 式 int(6) 
'\8866' // 无 类 型 文字 字符 ; 隐 式 rune('\888') 
0.0 // 无 类 型 浮 点 数 ; 隐 式 float64(8.8) 
6i // 无 类 型 整数 ; 隐 式 complex128(8i) 
注意 各 类 型 的 不 对 称 性 : 无 类 型 整数 可 以 转换 成 int， 其 大 小 不 确定 ， 但 无 类 型 浮 点 数 
和 无 类 型 复数 被 转换 成 大 小 明确 的 float64 和 complex128。Go 语言 中 ， 只 有 大 小 不 明确 的 
int 类 型 ， 却 不 存在 大 小 不 确定 的 float 类 型 和 complex 类 型 ， 原因 是 ， 如 果 浮 点 型 数据 的 大 
小 不 明 ， 就 很 难 写 出 正确 的 数值 算法 。 
要 将 变量 转换 成 不 同 的 类 型 ,我们 必须 将 无 类 型 常量 显 式 转换 为 期 望 的 类 型 ， 或 在 声明 
变量 时 指明 想 要 的 类 型 ， 如 下 例 所 示 : 
var i = int8(6) 
var i int8 = 6 
在 将 无 类 型 常量 转换 为 接口 值 时 ( 见 第 7 章 )， 这 些 默 认 类 型 就 分 外 重要 ， 因 为 它们 决 
定 了 接口 值 的 动态 类 型 。 


Nh 


fmt.Printf("%T\n", 8) J “ne 
fmt.Printf("%T\n", 8.06) // "float64" 
fmt.Printf("%T\n", 8i) // "complex128" 


fmt.Printf("%T\n", '\880') // "int32" (rune) 

至 此 ， 我 们 已 经 概述 了 Go 的 基本 数据 类 型 。 下 一 步 就 是 要 说 明 如 何 将 它们 构建 成 为 更 
大 的 聚合 体 ， 如 数组 和 结构 体 ， 更 进一步 组 成 数据 结构 以 解决 实际 的 编程 问题 。 第 4 章 以 此 
为 主题 。 | 
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第 3 章 讨 论 了 Go 程序 中 的 基础 数据 类 型 ;它们 就 像 宇宙 中 的 原子 一 样 。 本 章 介绍 复合 
数据 类 型 ， 复 合 数据 类 型 是 由 基本 数据 类 型 以 各 种 方式 组 合 而 构成 的 ， 就 像 分 子 由 原子 构成 
一 样 。 我 们 将 重点 讲解 四 种 复合 数据 类 型 ， 分 别 是 数组 、slice 、map 和 结构 体 。 另 外 本 章 未 
尾 将 演示 如 何 将 使 用 这 些 数据 类 型 构成 的 结构 化 数据 编码 为 JSON 数据 ， 从 JSON 数据 转换 
为 结构 化 数据 ， 以 及 从 模板 生成 HTML 页 面 。 

数组 和 结构 体 都 是 聚合 类 型 ， 它 们 的 值 由 内 存 中 的 一 组 变量 构成 。 数 组 的 元 素 具 有 相同 
的 类 型 ， 而 结构 体 中 的 元 素数 据 类 型 则 可 以 不 同 。 数 组 和 结构 体 的 长 度 都 是 固定 的 。 反 之 ， 
slice 和 map 都 是 动态 数据 结构 ， 它 们 的 长 度 在 元 素 添加 到 结构 中 时 可 以 动态 增长 。 


4.1 数组 


数组 是 具有 固定 长 度 且 拥 有 零 个 或 者 多 个 相同 数据 类 型 元 素 的 序列 。 由 于 数组 的 长 度 固 
定 ， 所 以 在 Go 里 面 很 少 直接 使 用 。slice 的 长 度 可 以 增长 和 缩短 ， 在 很 多 场合 下 使 用 得 更 多 。 
然而 ， 在 理解 slice 之 前 ， 我 们 必须 先 理解 数组 。 

数组 中 的 每 个 元 素 是 通过 索引 来 访问 的 ， 索 引 从 0 到 数组 长 度 减 1。Go 内 置 的 函数 len 
可 以 返回 数组 中 的 元 素 个 数 。 

var a [3]int // 3 个 整数 的 数组 

fmt.Println(a[6]) // 输出 数组 的 第 一 个 元 素 

fmt.Println(a[len(a)-1]) // 输出 数组 的 最 后 一 个 元 素 ， 即 [2] 

// 输出 索引 和 元 素 

for i, v := range af 

fmt.Printf("%d %d\n", i, v) 

} 


// 仅 输 出 元 素 

for _,v := range af 
fmt.Printf("%d\n", v) 

} 


默认 情况 下 ， 一 个 新 数组 中 的 元 素 初始 值 为 元 素 类 型 的 零 值 ， 对 于 数字 来 说 ， 就 是 0。 
也 可 以 使 用 数组 字面 量 根据 一 组 值 来 初始 化 一 个 数组 。 


var q [3]int = [3]int{1, 2，3} 
var r [3]int = [3]int{1, 2} 
fmt.Println(r[2]) // "86" 


在 数组 字面 量 中 ， 如 果 省 略 号 “...” 出 现在 数组 长 度 的 位 置 ， 那 么 数组 的 长 度 由 初始 化 
数组 的 元 素 个 数 决 定 。 以 上 数组 q 的 定义 可 以 简化 为 : 


qe Enelintti, ZT 
fmt.Printf("%T\n", q) // "“[3]int" 


数组 的 长 度 是 数组 类 型 的 一 部 分 ， 所 以 [3]int 和 [4]int 是 两 种 不 同 的 数组 类 型 。 数 组 
的 长 度 必须 是 常量 表达 式 ， 也 就 是 说 ， 这 个 表达 式 的 值 在 程序 编译 时 就 可 以 确定 。 
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d := [3]dntt1 Zs 3 
q = [4]int{1，2，3，4} // 编译 错误 : 不 可 以 将 [4]int 赋值 给 [3]int 


如 我 们 所 见 ， 数 组 、slice 、map 和 结构 体 的 字面 语法 都 是 相似 的 。 上 面 的 例子 是 按 顺 序 
给 出 一 组 值 ; 也 可 以 像 这 样 给 出 一 组 值 ， 这 一 组 值 同样 具有 索引 和 索引 对 应 的 值 : 
type Currency int 


const ( 
USD Currency = iota 
EUR 
GBP 
RMB 
) 


symbol := [...]string{USD: "$", EUR: "€", GBP: "£", RMB: "¥"} 
fmt.Println(RMB, symbol[RMB]) // "3 ¥" 


在 这 种 情况 下 ， 索 引 可 以 按照 任意 顺序 出 现 ， 并 且 有 的 时 候 还 可 以 省 略 。 和 上 面 一 样 ， 
没有 指定 值 的 索引 位 置 的 元 素 默 认 被 赋予 数组 元 素 类 型 的 零 值 。 例 如 ， 


Fr := [ss]int{99: =1} 


定义 了 一 个 拥有 100 个 元 素 的 数组 r"， 除 了 最 后 一 个 元 素 值 是 -1 外 ， 该 数组 中 的 其 他 
元 素 值 都 是 0。 

如 果 一 个 数组 的 元 素 类 型 是 可 比较 的 ， 那 么 这 个 数组 也 是 可 比较 的 ， 这 样 我 们 就 可 以 直 
接 使 用 == 操作 符 来 比较 两 个 数组 ， 比 较 的 结果 是 两 边 元 素 的 值 是 否 完全 相同 。 使 用 != 来 比 
较 两 个 数组 是 否 不 同 。 
= [2]int{1, 2} 

:= [...]int{1, 2} 
= [2]int{1, 3} 

fmt.Println(a == b, a == c, b == c) // "true false false" 

d := [3]int{1, 2} 

fmt.Println(a == d) // 编译 错误 : 无 法 比较 [2]int == [3]int 

举 一 个 更 有 意义 的 例子 ，crypto/sha256 包 里 面 的 函数 sum256 用 来 为 存储 在 任意 字 节 slice 
中 的 消息 使 用 SHA256 加 密 散 列 算法 生成 一 个 摘要 。 摘 要 信息 是 256 位 ， 即 [32]byte。 如 果 
两 个 摘要 信息 相同 ， 那 么 很 有 可 能 这 两 条 原始 消息 就 是 相同 的 ; 如 果 这 两 个 摘要 信息 不 同 ， 
那么 这 两 条 原始 消息 就 是 不 同 的 。 下 面 的 程序 输出 并 比较 了 "x" 和 "x" 的 SHA256 散 列 值 : 

gopl.io/ch4/sha256 | 

import "crypto/sha256" 


nSoy 


func main() { 
cl1 := sha256.Sum256([]byte("x")) 
c2 := sha256.Sum256([]byte("X")) 
fmt.Printf("%x\n%x\n%t\n%T\n", cl1, c2, c1 == c2, c1) 
// Output: 
// 2d711642b726b84461627ca9fbac32f5c8538fb1983cc4db82258717921a4881 
// 4b68ab3847feda7d6c62c1fbcbeebfa35eab7351ed5e78f4ddadea5df64b8815 
// false 
// [32]uint8 
小 


这 两 个 原始 消息 仅 有 一 位 (bit) 之 差 ， 但 是 它们 生成 的 摘要 消息 有 将 近 一 半 的 位 不 同 。 
注意 ， 上 面 的 格式 化 字符 串 ‰ 表示 将 一 个 数组 或 者 slice 里 面 的 字 节 按照 十 六 进 制 的 方式 输 
出 ，%t 表示 输出 一 个 布尔 值 ，%T 表示 输出 一 个 值 的 类 型 。 
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当 调 用 一 个 函数 的 时 候 ， 每 个 传人 的 参数 都 会 创建 一 个 副本 ， 然 后 赋值 给 对 应 的 函数 变 
量 ， 所 以 函数 接受 的 是 一 个 副本 ， 而 不 是 原始 的 参数 。 使 用 这 种 方式 传递 大 的 数组 会 变 得 
很 低 效 ， 并 且 在 函数 内 部 对 数组 的 任何 修改 都 仅 影响 副本 ， 而 不 是 原始 数组 。 这 种 情况 下 ， 
Go 把 数组 和 其 他 的 类 型 都 看 成 值 传递 。 而 在 其 他 的 语言 中 ， 数 组 是 隐 式 地 使 用 引用 传递 。 

当然 ， 也 可 以 显 式 地 传递 一 个 数组 的 指针 给 函数 ， 这 样 在 函数 内 部 对 数组 的 任何 修改 都 
会 反映 到 原始 数组 上 面 。 下 面 的 程序 演示 如 何 将 一 个 数组 [32]byte 的 元 素 清 零 : 


func zero(ptr *[32]byte) { 
for i := range ptr { 
ptr[i] = 6 


}) 
数组 字面 量 [32]byte{} 可 以 生成 一 个 拥有 32 个 字 节 元 素 的 数组 。 数 组 中 每 个 元 素 的 值 
都 是 字 节 类 型 的 零 值 ， 即 0。 可 以 利用 这 一 点 来 写 另 一 个 版 本 的 数组 清 零 程 序 ， 


func zero(ptr *[32]byte) { 
*ptr = [32]byte{} 
} 


使 用 数组 指针 是 高 效 的 ， 同 时 允许 被 调 函 数 修改 调用 方 数组 中 的 元 素 ， 但 是 因为 数组 长 
度 是 固定 的 ， 所 以 数组 本 身 是 不 可 变 的 。 例 如 上 面 的 zero 函数 不 能 接受 一 个 [16]byte 这 样 的 
数组 指针 ， 同 样 ， 也 无 法 为 数组 添加 或 者 删除 元 素 。 由 于 数组 的 长 度 不 可 变 的 特性 ， 除 了 在 特 
殊 的 情况 下 之 外 ， 我 们 很 少 使 用 数组 。 上 面 关于 SHA256 的 例子 中 ， 摘 要 的 结果 拥有 固定 的 长 
度 , 我 们 可 以 使 用 数组 作为 函数 参数 或 结果 ,但 是 更 多 的 情况 下 ， 我 们 使 用 slice。 

练习 4.1: 编写 一 个 函数 ， 用 于 统计 SHA256 散 列 中 不 同 的 位 数 ( 见 2.6.2 节 的 popcount )。 

练习 4.2: 编写 一 个 程序 ， 用 于 在 默认 情况 下 输出 其 标准 输入 的 SHA256 散 列 ， 但 也 支持 
一 个 输出 SHA384 或 SHA512 散 列 的 命令 行 标记 。 


4.2 slice 


slice 表示 一 个 拥有 相同 类 型 元 素 的 可 变 长 度 的 序列 。slice 通常 写成 [IT， 其 中 元 素 的 类 
型 都 是 T; 它 看 上 去 像 没 有 长 度 的 数组 类 型 。 

数组 和 slice 是 紧密 关联 的 。slice 是 一 种 轻 量 级 的 数据 结构 ， 可 以 用 来 访问 数组 的 部 分 
或 者 全 部 的 元 素 ， 而 这 个 数组 称 为 slice 的 底层 数组 。slice 有 三 个 属性 : 指针 、 长 度 和 容量 。 
指针 指向 数组 的 第 一 个 可 以 从 slice 中 访问 的 元 素 ， 这 个 元 素 并 不 一 定 是 数组 的 第 一 个 元 素 。 
长 度 是 指 slice 中 的 元 素 个 数 ， 它 不 能 超过 slice 的 容量 。 容 量 的 大 小 通常 是 从 slice 的 起 始 元 
素 到 底层 数组 的 最 后 一 个 元 素 间 元 素 的 个 数 。Go 的 内 置 函数 len 和 cap 用 来 返回 slice 的 长 
度 和 容量 。 

一 个 底层 数组 可 以 对 应 多 个 slice， 这 些 slice 可 以 引用 数组 的 任何 位 置 ， 彼 此 之 间 的 元 
素 还 可 以 重 倒 。 图 4-1 显示 了 一 个 月 份 名 称 的 字符 串 数组 和 两 个 元 素 存 在 重 释 的 slice。 数 组 
声明 是 : 

months := [...]string{1: "January", /* ... */, 12: "December"} 

所 以 January 就 是 months[1]，December 是 months[12]。 一 般 来 讲 ， 数 组 中 索引 0 的 位 


置 存放 数组 的 第 一 个 元 素 , 但 是 由 于 月 份 总 是 从 1 开始 ， 因 此 我 们 可 以 不 设置 索引 为 0 的 元 
素 ， 这样 它 的 值 就 是 空 字符 串 。 





months 










summer = months[6:9] 


“March” 





“April” 


.len 


1 


3 小 


本 


Co 
“en 


. cap 


4 
4 
8 


图 4-1 月 份 名 称 字符 串 数组 对 应 的 两 个 元 素 重合 的 slice 


slice 操作 符 s[i:j] (其 中 6。<i<j< cap(s)) 创建 了 一 个 新 的 slice， 这 个 新 的 slice 引用 
了 序列 s 中 从 i 到 j-1 索 引 位 置 的 所 有 元 素 ， 这 里 的 s 既 可 以 是 数组 或 者 指向 数组 的 指针 ， 
也 可 以 是 slice。 新 slice 的 元 素 个 数 是 j-i 个。 如 果 上 面 的 表达 式 中 省 略 了 i， 那 么 新 slice 
的 起 始 索引 位 置 就 是 0， 即 i=@e ; 如 果 省 略 了 j， 那 么 新 slice 的 结束 索引 位 置 是 len(s)-1， 
即 j=len(s)。 因 此 slicemonths[1:13] 引用 了 所 有 的 有 效 月 份 ， 同样 的 写法 可 以 是 months[1:]。 
slicemonths[:] 引用 了 整个 数组 。 接 下 来 ， 我 们 定义 元 素 重 和 至 的 slice， 分 别 用 来 表示 第 二 季 
度 的 月 份 和 北半球 的 夏季 月 份 : 


Q2 := months[4:7] 

summer := months[6:9] 

fmt.Println(Q2) // ["April" "May" "June"] 
fmt.Println(summer) // ["June" "July" "August"] 


元 素 June 同时 包含 在 两 个 slice 中 。 用 下 面 的 代码 来 输出 两 个 slice 的 共同 元 素 (虽然 效 
率 不 高 )， 


. cap 





for _, s := range summer { 
for _, 9q := range Q2 { 
4 村 


fmt.Printf("%s appears in both\n", s) 


= 


} 
} 


如 果 slice 的 引用 超过 了 被 引用 对 象 的 容量 ， 即 cap(s)， 那 么 会 导致 程序 宕 机 ; 但 是 如 果 
slice 的 引用 超出 了 被 引用 对 象 的 长 度 ， 即 len(s)， 那 么 最 终 slice 会 比 原 slice 长 : 


fmt .Println(summer[:26]) // 宕 机 : 超过 了 被 引用 对 象 的 边界 


endlessSummer := summer[:5] // 在 slice 容量 范围 内 扩展 了 slice 
fmt.println(endlessSummer) // "[June July August September October]" 
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另外 ， 注 意 求 字符 串 (string) 子 串 操作 和 对 字 节 slice ([]byte) 做 slice 操作 这 两 者 的 相 
似 性 。 它 们 都 写作 x[m:n] ， 并 且 都 返回 原始 字 节 的 一 个 子 序列 ， 同 时 它们 的 底层 引用 方式 也 
是 相同 的 ， 所 以 两 个 操作 都 消耗 常量 时 间 。 区 别 在 于 : 如 果 x 是 字符 串 ， 那 么 x[m:n] 返回 的 
是 一 个 字符 串 ; 如果 x 是 字 节 slice， 那 么 返回 的 结果 是 字 节 slice。 

因为 slice 包含 了 指向 数组 元 素 的 指针 ， 所 以 将 一 个 slice 传递 给 函数 的 时 候 ， 可 以 在 
盟 数 内 部 修改 底层 数组 的 元 素 。 换 言 之 ， 创 建 一 个 数组 的 slice 等 于 为 数组 创建 了 一 个 别名 
( 见 23.2 节 )。 下 面 的 函数 reverse 就 地 反 转 了 整 型 slice 中 的 元 素 ， 它 适用 于 任意 长 度 的 整 
型 slice。 

gopl.io/ch4/rev 
// 就 地 反 转 一 个 整 型 slice 中 的 元 素 
func reverse(s []int) { 
for i, J := 8, len(s)-1; i < 了 可 i se Pe hs ef 
s[i], s[j] = s[j], s[i] 


} 
这 里 ， 反 转 整 个 数组 a: 


a := [...]int{e，1，2，3，4，5} 
reverse(a[:]) 
fmt.Println(a) // "[54321 08]" 


将 一 个 slice 左 移 n 个 元 素 的 简单 方法 是 连续 调用 reverse 函数 三 次 。 第 一 次 反 转 前 个 
元 素 ， 第 二 次 反 转 剩 下 的 元 素 ， 最 后 对 整个 slice 再 做 一 次 反 转 (如果 将 元 素 右 移 n 个 元 素 ， 
那么 先 做 第 三 次 调用 )。 

s := [Jint{0, 1, 2, 3, 4, 5} 

// 向 左 移动 两 个 元 素 

reverse(s[:2]) 

reverse(s[2:]) 

reverse(S) 

fmt.Println(s) // "[2345081]" 

注意 初始 化 slice s 的 表达 式 和 初始 化 数组 a 的 表达 式 的 区 别 。slice 字面 量 看 上 去 和 数 
组 字面 量 很 像 ， 都 是 用 逗号 分 隔 并 用 花 括号 括 起 来 的 一 个 元 素 序列 ， 但 是 slice 没有 指定 长 
度 。 这 种 隐 式 区 别 的 结果 分 别 是 创建 有 固定 长 度 的 数组 和 创建 指向 数组 的 slice。 和 数组 一 
样 ，slice 也 按照 顺序 指定 元 素 ， 也 可 以 通过 索引 来 指定 元 素 ， 或 者 两 者 结合 。 

和 数组 不 同 的 是 ，slice 无 法 做 比较 ， 因 此 不 能 用 == 来 测试 两 个 slice 是 否 拥有 相同 的 元 
素 。 标 准 库 里 面 提供 了 高 度 优化 的 函数 bytes.Equal 来 比较 两 个 字 节 slice ( [J]byte)。 但 是 对 
于 其 他 类 型 的 slice， 我 们 必须 自己 写 函 数 来 比较 。 

func equal(x，y []string) bool { 

if len(x) != len(y) { 
return false 


了 
for i := range x { 
if x[i] != y[i] { 
return false 
} 


return true 


这 种 深度 比较 看 上 去 很 简单 ， 并 且 运 行 的 时 候 并 不 比 字 符 串 数组 使 用 -= 做 比较 多 耗费 
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时 间 。 你 或 许 奇 怪 为 什么 slice 比较 不 可 以 直接 使 用 == 操作 符 做 比较 。 这 里 有 两 个 原因 。 首 
先 ， 和 数组 元 素 不 同 ，slice 的 元 素 是 非 直接 的 ， 有 可 能 slice 可 以 包含 它 自身 。 虽 然 有 办 法 
处 理 这 种 特殊 的 情况 ， 但 是 没有 一 种 方法 是 简单 、 高 效 、 直 观 的 。 

其 次 ， 因 为 slice 的 元 素 不 是 直接 的 ， 所 以 如 果 底 层 数组 元 素 改变 ， 同 一 个 slice 在 不 同 
的 时 间 会 拥有 不 同 的 元 素 。 由 于 散 列表 (例如 Go 的 map 类 型 ) 仅 对 元 素 的 键 做 浅 拷贝 ， 这 
就 要 求 散 列表 里 面 键 在 散 列 表 的 整个 生命 周期 内 必须 保持 不 变 。 因 为 slice 需要 深度 比较 ， 
所 以 就 不 能 用 slice 作为 map 的 键 。 对 于 引用 类 型 ， 例 如 指针 和 通道 ， 操 作 符 == 检查 的 是 引 
用 相等 性 ， 即 它们 是 否 指向 相同 的 元 素 。 如 果 有 一 个 相似 的 slice 相等 性 比较 功能 ， 它 或 许 
会 比较 有 用 ， 也 能 解决 slice 作为 map 键 的 问题 ， 但 是 如 果 操作 符 == 对 slice 和 数组 的 行为 
不 一 致 ， 会 带 来 困扰 。 所 以 最 安全 的 方法 就 是 不 允许 直接 比较 slice。 

slice 唯一 允许 的 比较 操作 是 和 nil 做 比较 ,例如 : 

if summer == nil { /* ,.，*#/ } 

slice 类 型 的 零 值 是 nil。 值 为 nil 的 slice 没 有 对 应 的 底层 数组 。 值 为 nil 的 slice 长 
度 和 容量 都 是 零 ， 但 是 也 有 非 nil 的 slice 长 度 和 容量 是 零 ， 例 如 []int{] 或 make([]int,3) 
[3:]。 对 于 任何 类 型 ， 如 果 它 们 的 值 可 以 是 nil， 那 么 这 个 类 型 的 nil 值 可 以 使 用 一 种 转换 
表达 式 ， 例 如 []int(nil)。 


var s []int // len(s) == 0, s == nil 
s = nil // len(s) == 0, s == nil 
s = []int(nil) // len(s) == 6, s == nil 
s = [J]int{} // len(s) == 0, s != nil 


所 以 ， 如 果 想 检查 一 个 slice 是 否 是 空 ， 那 么 使 用 len(s) == 9， 而 不 是 s == nil， 因 为 
s 1- nil 的 情况 下 ，slice 也 有 可 能 是 空 。 除 了 可 以 和 nil 做 比较 之 外 ， 值 为 nil 的 slice 表现 
和 其 他 长 度 为 零 的 slice 一 样 。 例 如 ，reverse 函数 调用 reverse(nil) 也 是 安全 的 。 除 非 文 档 
上 面 写 明了 与 此 相反 ， 否 则 无 论 值 是 否 为 nil，Go 的 函数 都 应 该 以 相同 的 方式 对 待 所 有 长 度 
为 零 的 slice。 

内 置 函 数 make 可 以 创建 一 个 具有 指定 元 素 类 型 、 长 度 和 容量 的 slice。 其 中 容量 参数 可 
以 省 略 ， 在 这 种 情况 下 ，slice 的 长 度 和 容量 相等 。 


make([]T, len) 
make([]T, len, cap) // 和 make([]T， cap)[:len] 功能 相同 


深入 研究 下 ， 其 实 make 创建 了 一 个 无 名 数组 并 返回 了 它 的 一 个 slice ; 这 个 数组 仅 可 以 
通过 这 个 slice 来 访问 。 在 上 面 的 第 一 行 代码 中 ， 所 返回 的 slice 引用 了 整个 数组 。 在 第 二 行 
代码 中 ，slice 只 引用 了 数组 的 前 len 个 元 素 ， 但 是 它 的 容量 是 数组 的 长 度 ， 这 为 未 来 的 slice 
元 素 留 出 空间 。 

4.2.1 append 函数 

内 置 函 数 append 用 来 将 元 素 追 加 到 slice 的 后 面 。 

var runes []rune 


for ，r := range "Hello,， 世界 " { 
runes = append(runes, r) 
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虽然 最 方便 的 用 法 是 []rune("Hello, 世界 ")， 但 是 上 面 的 循环 演示 了 如 何 使 用 append 来 
为 一 个 rune 类 型 的 slice 添加 元 素 。 
append 困 数 对 理解 slice 的 工作 原理 很 重要 ， 接 下 来 看 一 个 为 []int 数组 slice 定义 的 方 


法 appendInt. 


gopl1.io/ch4/append 
func appendInt(x []int，y int) []int { 

var z []int 

zlen := len(x) + 1 

if zlen <= cap(x) { 
// slice 仍 有 增长 空间 ， 扩 展 slice 内 容 
z = x[:zlen] 

} else { 

”。 V/ slice 已 无 空间 ， 为 它 分 配 一 个 新 的 底层 数组 
// 为 了 达到 分 摊 线 性 复杂 性 ， 容 量 扩展 一 倍 
zcap := zlen 
if zcap < 2*len(x) { 

zcap = 2 * len(x) 

} 
z = make([]int, zlen, zcap) 
copy(z，Xx) // 内 置 copy 函数 

} 

z[len(x)] = y 

return z 


} 


每 一 次 appendInt 调用 都 必须 检查 slice 是 否 仍 有 足够 容量 来 存储 数组 中 的 新 元 素 。 如 果 
slice 容量 足够 ， 那 么 它 就 会 定义 一 个 新 的 slice (仍然 引用 原始 底层 数组 )， 然 后 将 新 元 素 y 
复制 到 新 的 位 置 ， 并 返回 这 个 新 的 slice。 输 入 参数 slice x 和 函数 返回 值 slice z 拥有 相同 的 
底层 数组 。 

如 果 slice 的 容量 不 够 容纳 增长 的 元 素 ，appendInt 函数 必须 创建 一 个 拥有 足够 容量 的 新 
的 底层 数组 来 存储 新 元 素 ， 然 后 将 元 素 从 slice x 复制 到 这 个 数组 ， 再 将 新 元 素 y 追加 到 数组 
后 面 。 返 回 值 slice z 将 和 输入 参数 slice x 引用 不 同 的 底层 数组 。 

使 用 循环 语句 来 复制 元 素 看 上 去 直观 一 点 ， 但 是 使 用 内 置 函 数 copy 将 更 简单 ，copy 函 
数 用 来 为 两 个 拥有 相同 类 型 元 素 的 slice 复制 元 素 。copy 函数 的 第 一 个 参数 是 目标 slice， 第 
二 个 参数 是 源 slice，copy 数 将 源 slice 中 的 元 素 复制 到 目标 slice 中 ， 这 个 和 一 般 的 元 素 赋 
值 有 点 像 ， 比 如 dest=src。 不 同 的 slice 可 能 对 应 相同 的 底层 数组 ， 甚 至 可 能 存在 元 素 重 秋 。 
copy 函数 有 返回 值 ， 它 返回 实际 上 复制 的 元 素 个 数 ， 这 个 值 是 两 个 slice 长 度 的 较 小 值 。 所 
以 这 里 不 存在 由 于 元 素 复制 而 导致 的 索引 越界 问题 。 

出 于 效率 的 考虑 ， 新 创建 的 数组 容量 会 比 实际 容纳 slice x 和 slice y 所 需要 的 最 小 长 度 
更 大 一 点 。 在 每 次 数组 容量 扩展 时 ， 通 过 扩展 一 倍 的 容量 来 减少 内 存 分 配 的 次 数 ， 这 样 也 可 
以 保证 追加 一 个 元 素 所 消耗 的 是 固定 时 间 。 下 面 的 程序 演示 了 这 个 效果 ， 

func main() { 

var x, y [Jint 

for i := 60; i < 16; i++ { 
y = appendInt(x, i) 
fmt.Printf("%d cap=%d\t%v\n", i, cap(y), y) 
x=y 


} 
} 
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@ cap=1 [8] 

1 cap=2 [8 1] 

2 ap=4 [84142] 

3 cap=4 [612 3] 

4 cap=8 [61234] 

5 cap=8 [e612345] 

6 cap=8 [6123456] 

7 cap=8 [6061234567] 

8 cap=16 [612345678] 

9 cap=16 [6123456789] 


我 们 来 仔细 看 一 下 当 i=3 时 的 情况 。 这 个 时 候 slice x 拥有 三 个 元 素 [e 1 2]， 但 是 容量 
是 4， 这 个 时 候 slice 最 后 还 有 一 个 空位 置 ， 所 以 调用 appendInt 追加 元 素 3 的 时 候 ， 没 有 发 
生 底层 数组 重新 分 配 。 调 用 的 结果 是 slice 的 长 度 和 容量 都 是 4， 并 且 这 个 结果 slice 和 x 一 
样 拥有 相同 的 底层 数组 ， 如 图 4-2 所 示 。 





“len=cap=4 "+e * y = appendInt(x，3) 


图 4-2 有 容量 元 素 的 增长 


在 下 一 次 循环 中 i=4， 这 个 时 候 原 来 的 slice 已 经 没有 空间 了 ， 所 以 appendInt 函数 分 配 
了 一 个 长 度 为 8 的 新 数组 。 然 后 将 x 中 的 4 个 元 素 [e 1 2 3] 都 复制 到 新 的 数组 中 ， 最 后 再 
追加 新 元 素 i。 这 样 结果 slice 的 长 度 就 是 5， 而 容量 是 8。 多 分 配 的 三 个 位 置 就 留 给 接 下 来 
的 循环 添加 值 使 用 ， 在 接 下 来 的 三 次 循环 中 ， 就 不 需要 再 重新 分 配 空间 。 所 以 y 和 x 是 不 同 
数组 的 slice。 这 个 操作 过 程 如 图 4-3 所 示 。 





图 4-3 无 容量 元 素 的 增长 


内 置 的 append 函数 使 用 了 比 这 里 的 appendInt 更 复杂 的 增长 策略 。 通 常情 况 下， 我 们 并 
不 清楚 一 次 append 调用 会 不 会 导致 一 次 新 的 内 存 分 配 ， 所 以 我 们 不 能 假设 原始 的 slice 和 调 
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用 append 后 的 结果 slice 指向 同一 个 底层 数组 ， 也 无 法 证 明 它 们 就 指向 不 同 的 底层 数组 。 同 
样 ， 我 们 也 无 法 假设 旧 slice 上 对 元 素 的 操作 会 或 者 不 会 影响 新 的 slice 元 素 。 所 以 ， 通常 我 
们 将 append 的 调用 结果 再 次 赋值 给 传人 append 函数 的 slice: 


runes = append(runes, r) 


不 仅仅 是 在 调用 append 琐 数 的 情况 下 需要 更 新 slice 变量 。 另 外 ， 对 于 任何 函数 ， 只 要 
有 可 能 改变 slice 的 长 度 或 者 容量 ， 抑 或 是 使 得 slice 指向 不 同 的 底层 数组 ， 都 需要 更 新 slice 
变量 。 为 了 正确 地 使 用 slice， 必 须 记 住 ， 虽 然 底层 数组 的 元 素 是 间接 引用 的 ， 但 是 slice 的 
指针 、 长 度 和 容量 不 是 。 要 更 新 一 个 slice 的 指针 ， 长 度 或 容量 必须 使 用 如 上 所 示 的 显 式 赋 
值 。 从 这 个 角度 看 ，slice 并 不 是 纯 引 用 类 型 ， 而 是 像 下 面 这 种 聚合 类 型 ， 


type IntSlice struct { 
ptr *int 
len, cap int 


} 


appendInt 阴 数 只 能 给 slice 添加 一 个 元 素 ， 但 是 内 置 的 append 函数 可 以 同时 给 slice 添 
加 多 个 元 素 ， 甚 至 添加 另 一 个 slice 里 的 所 有 元 素 。 


var x []int 

x = append(x, 1) 

x = append(x，2，3) 

x = append(x, 4, 5, 6) 

xX = append(x，x...) // 追加 Xx 中 的 所 有 元 素 


fmt.Println(x) // "[123456123456]" 
可 以 简单 修改 一 下 appendInt 函数 来 匹配 append 的 功能 。 函 数 appendInt 参数 声明 中 的 
省 略 号 “... ”表示 该 函数 可 以 接受 可 交 长 度 参 数列 表 。 上 面 例子 中 append 函数 的 参数 后 面 


的 省 略 号 表示 如 何 将 一 个 slice 转换 为 参数 列表 。5.7 节 会 详细 解释 这 种 机 制 。 


func appendInt(x []int，y ...int) []int { 
var z []int 
zlen := len(x) + len(y) 
// ... 扩展 slice z 的 长 度 至 少 到 zlen... 
copy(z[len(x):], y) 
return z 


中 
扩展 slice z 底层 数组 的 逻辑 和 上 面 一 样 ， 所 以 就 不 重复 了 。 


4.2.2 slice 就 地 修改 

我 们 多 看 一 些 就 地 使 用 slice 的 例子 ， 比 如 rotate 和 reverse 这 种 可 以 就 地 修改 slice 元 
素 的 函数 。 下 面 的 函数 nonempty 可 以 从 给 定 的 一 个 字符 串 列 表 中 去 除 空 字符 串 并 返回 一 个 新 
的 slice。 


gopl.io/ch4/nonempty 


// Nonempty 演示 了 slice 的 就 地 修改 算法 
package main 





import "fmt" 


// nonempty 返回 一 个 新 的 slice，slice 中 的 元 素 都 是 非 空 字符 串 
// 在 函数 的 调用 过 程 中 ， 底 层 数 组 的 元 素 发 生 了 改变 
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func nonempty(strings []string) []string { 


i:= 0 
for _, s := range strings { 
if. 8: Pe "4 
strings[i] = s 
I++ 
} 


return strings[:i] 


} 


这 里 有 一 点 是 输入 的 slice 和 输出 的 slice 拥有 相同 的 底层 数组 ， 这 样 就 避免 在 函数 内 部 
重新 分 配 一 个 数组 。 当 然 ， 这 种 情况 下 ， 底 层 数组 的 元 素 只 是 部 分 被 修改 ， 示 例如 下 : 
data := []string{"one", "", "three"} 


fmt.Printf("%q\n", nonempty(data)) // “["one" "three"] 
fmt.Printf("%q\n", data) // ~“["one" "three" "three"] 


因此 ， 通 常 我 们 会 这 样 来 写 : data = noempty(data)。 
函数 nonempty 还 可 以 利用 append 函数 来 写 : 
func nonempty2(strings []string) []string { 
out := strings[:8] // 引用 原始 slice 的 新 的 零 长 度 的 slice 
for _, s := range strings { 
ifsl=""{ 
out = append(out, s) 
} 
} 


return out 


} 


无 论 使 用 哪 种 方式 ， 重 用 底层 数组 的 结果 是 每 一 个 输入 值 的 slice 最 多 只 有 一 个 输出 的 
结果 slice， 很 多 从 序列 中 过 滤 元 素 再 组 合 结果 的 算法 都 是 这 样 做 的 。 这 种 精细 的 slice 使 用 
方式 只 是 一 个 特例 ， 并 不 是 规则 ， 但 是 偶尔 这 样 做 可 以 让 实现 更 清晰 、 高 效 、 有 用 。 

slice 可 以 用 来 实现 栈 。 给 定 一 个 空 的 slice 元 素 stack， 可 以 使 用 append 向 slice 尾部 追 
加 值 : 


stack = append(stack，v) // push v 
栈 的 顶部 是 最 后 一 个 元 素 : 

top := stack[len(stack)-1] // 栈 顶 
通过 弹出 最 后 一 个 元 素来 缩减 栈 : 


stack = stack[:len(stack)-1] // pop 


为 了 从 slice 的 中 间 移 除 一 个 元 素 ， 并 保留 剩余 元 素 的 顺序 ， 可 以 使 用 函数 copy 来 将 高 
位 索引 的 元 素 向 前 移动 来 覆盖 被 移 除 元 素 所 在 位 置 : 


func remove(slice []int，i int) []int { 
copy(slice[i:], slice[i+1:]) 
return slice[:len(slice)-1] 

} 

func main() { 
s := [Jint{5, 6, 7, 8, 9} 
fmt.Println(remove(s, 2)) // "[5 6 8 9]" 
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如 果 不 需 要 维持 slice 中 剩余 元 素 的 顺序 ， 可 以 简单 地 将 slice 的 最 后 一 个 元 素 赋 值 给 被 
移 除 元 素 所 在 的 索引 位 置 : 


func remove(slice []int，i int) []int { 
slice[i] = slice[len(slice)-1] 
return slice[:len(slice)-1] 


小 


func main() { 
s := []int{5, 6, 7, 8, 9} 
fmt.Println(remove(s, 2)) // "[5 6 9 8] 
} 


练习 4.3: 重 写 函数 reverse， 使 用 数组 指针 作为 参数 而 不 是 slice。 

练习 4.4: 编写 一 个 函数 rotate， 实 现 一 次 遍历 就 可 以 完成 元 素 旋转 。 

练习 4.5: 编写 一 个 就 地 处 理 函数 ， 用 于 去 除 []string slice 中 相 邻 的 重复 字符 串 元 素 。 

练习 4.6: 编写 一 个 就 地 处 理 函数 ， 用 于 将 一 个 UTF-8 编码 的 字 节 slice 中 所 有 相 邻 的 
Unicode 空白 字符 (查看 unicode.Isspace ) 缩减 为 一 个 ASCII 空白 字符 。 

练习 4.7: 修改 函数 reverse， 来 翻转 一 个 UTF-8 编码 的 字符 串 中 的 字符 元 素 ， 传 人 参数 是 
该 字符 串 对 应 的 字 节 slice 类 型 ( []byte )。 你 可 以 做 到 不 需要 重新 分 配 内 存 就 实现 该 功能 吗 ? 


4.3 map 


散 列表 是 设计 精妙 、 用 途 广泛 的 数据 结构 之 一 。 它 是 一 个 拥有 键 值 对 元 素 的 无 序 集合 。 
在 这 个 集合 中 ， 键 的 值 是 唯一 的 ， 键 对 应 的 值 可 以 通过 键 来 获取 、 更 新 或 移 除 。 无 论 这 个 散 
列表 有 多 大 ， 这 些 操作 基本 上 是 通过 常量 时 间 的 键 比 较 就 可 以 完成 。 

在 Go 语言 中 ，map 是 散 列表 的 引用 ，map 的 类 型 是 map[kJv, 其 中 k 和 v 是 字典 的 键 和 
值 对 应 的 数据 类 型 。map 中 所 有 的 键 都 拥有 相同 的 数据 类 型 ， 同 时 所 有 的 值 也 都 拥有 相同 的 
数据 类 型 ， 但 是 键 的 类 型 和 值 的 类 型 不 一 定 相 同 。 键 的 类 型 k， 必 须 是 可 以 通过 操作 符 == 来 
进行 比较 的 数据 类 型 ， 所 以 map 可 以 检测 某 一 个 键 是 否 已 经 存在 。 虽 然 浮 点 型 是 可 以 比较 
的 ， 但 是 比较 浮 点 型 的 相等 性 不 是 一 个 好 主意 ， 如 第 3 章 所 述 ， 尤 其 是 在 NaN 可 以 是 浮 点 
型 值 的 时 候 。 当 然 ， 值 类 型 v 没有 任何 限制 。 

内 置 函数 make 可 以 用 来 创建 一 个 map: 


ages := make(map[string]int) // 创建 一 个 从 string 到 int 的 map 


也 可 以 使 用 map 的 字面 量 来 新 建 一 个 带 初始 化 键 值 对 元 素 的 字典 : 


ages := map[string]int{ 
"alice": 31， 
"charlie": 34， 


} 
这 个 等 价 于 : 


ages := make(map[string]int) 
ages["alice"] = 31 
ages["charlie"] = 34 


因此 ， 新 的 空 map 的 另外 一 种 表达 式 是 : map[string]int{}。 
map 的 元 素 访问 也 是 通过 下 标的 方式 : 


ages["alice"] = 32 
fmt.Println(ages["alice"]) // "32" 


和 2 


流 
A 
地 


可 以 使 用 内 置 函 数 delete 来 从 字典 中 根据 键 移 除 一 个 元 素 : 

delete(ages，"alice") // 移 除 元 素 ages["alice"] 

即使 键 不 在 map 中 ， 上 面 的 操作 也 都 是 安全 的 。map 使 用 给 定 的 键 来 查找 元 素 ， 如 果 
对 应 的 元 素 不 存在 ， 就 返回 值 类 型 的 零 值 。 例 如 ， 下 面 的 代码 同样 可 以 工作 ， 尽 管 "bob" 还 
不 是 map 的 键 ， 因 为 ages["bob"] 的 值 是 9。 

ages["bob"] = ages["bob"] + 1 // 生日 快乐 

快捷 赋值 方式 (如 x+=y 和 x++) 对 map 中 的 元 素 同样 适用 ， 所 以 上 面 的 代码 还 可 以 写成 : 


ages["bob"] += 1 

或 者 更 简洁 的 : 

ages["bob"]++ 

但 是 map 元 素 不 是 一 个 变量 ,不 可 以 获取 它 的 地 址 ， 比 如 这 样 是 不 对 的 : 
_ = &ages["bob"] // 编译 错误 ,无 法 获取 map 元 素 的 地 址 


我 们 无 法 获取 map 元 素 的 地 址 的 一 个 原因 是 map 的 增长 可 能 会 导致 已 有 元 素 被 重新 散 
列 到 新 的 存储 位 置 ， 这 样 就 可 能 使 得 获取 的 地 址 无 效 。 

可 以 使 用 for 循环 (结合 range 关键 字 ) 来 遍历 map 中 所 有 的 键 和 对 应 的 值 ， 就 像 上 面 
遍历 slice 一 样 。 循 环 语句 的 连续 迭代 将 会 使 得 变量 name 和 age 被 赋予 map 中 的 下 一 对 键 
和 值 。 

for name，age := range ages { 


fmt.Printf("%s\t%d\n", name, age) 
} 


map 中 元 素 的 迭代 顺序 是 不 固定 的 ， 不 同 的 实现 方法 会 使 用 不 同 的 散 列 算法 ， 得 到 不 同 
的 元 素 顺序 。 实 践 中 ， 我 们 认为 这 种 顺序 是 随机 的 ， 从 一 个 元 素 开始 到 后 一 个 元 素 ， 依 次 执 
行 。 这 个 是 有 意 为 之 的 ， 这 样 可 以 使 得 程序 在 不 同 的 散 列 算法 实现 下 变 得 健壮 。 如 有 果 需 要 按 
照 某 种 顺序 来 遍历 map 中 的 元 素 ， 我 们 必须 显 式 地 来 给 键 排序 。 例 如 ， 如 果 键 是 字符 串 类 
型 ， 可 以 使 用 sort 包 中 的 strings 函数 来 进行 键 的 排序 ， 这 是 一 种 常见 的 模式 : 


import "sort" 





var names []string 
for name := range ages { 
names = append(names, name) 


} 
sort.Strings(names) 
for _, name := range names { 


fmt.Printf("%s\t%d\n", name, ages[name]) 
上 


因为 我 们 一 开始 就 知道 slice names 的 长 度 ， 所 以 直接 指定 一 个 slice 的 长 度 会 更 加 高 效 . 
下 面 的 语句 创建 了 一 个 初始 元 素 为 空 但 是 容量 足够 容纳 ages map 中 所 有 键 的 slice: 


names := make([]string, 8, len(ages)) 


在 上 面 的 第 一 个 循环 中 ， 我们 只 需要 map ages 的 所 有 键 ， 所 以 我 们 忽略 了 循环 中 的 第 
二 个 变量 。 在 第 二 个 循环 中 ， 我 们 只 需要 使 用 slice names 中 的 元 素 值 ， 所 以 我 们 使 用 空白 标 


复合 数据 类型 73 





识 符 -来 忽略 第 一 个 变量 ， 即 元 素 索引 。 
map 类 型 的 零 值 是 ni1， 也 就 是 说 ， 没 有 引用 任何 散 列表 。 


var ages map[string]int 
fmt.Println(ages == nil) // "true" 
fmt.Println(len(ages) == 0) // "true" 


大 多 数 的 map 操作 都 可 以 安全 地 在 map 的 零 值 nil 上 执行 ， 包 括 查 找 元 素 ， 删 除 元 素 ， 
获取 map 元 素 个 数 (len)， 执 行 range 循环 ， 因 为 这 和 空 map 的 行为 一 致 。 但 是 向 零 值 map 
中 设置 元 素 会 导致 错误 : 

ages["carol"] = 21 // 宕 机 : 为 零 值 map 中 的 项 赋值 


设置 元 素 之 前 ， 必 须 初 始 化 map。 

通过 下 标的 方式 访问 map 中 的 元 素 总 是 会 有 值 。 如 果 键 在 map 中 ， 你 将 得 到 键 对 应 的 
值 ; 如 果 键 不 在 map 中 ， 你 将 得 到 map 值 类 型 的 零 值 ， 如 同 对 于 ages["bob"] 的 操作 结果 。 
很 多 情况 下 ， 这 个 没有 问题 ， 但 是 有 时 候 你 需要 知道 一 个 元 素 是 否 在 map 中 。 例 如 ， 如 果 
元 素 类 型 是 数值 类 型 ， 你 需要 能 够 辨别 一 个 不 存在 的 元 素 或 者 恰好 这 个 元 素 的 值 是 0， 可 以 
这 样 做 : 


age, ok := ages["bob"] 
if lok { /* "bob” 不 是 字典 中 的 键 , age == 8 */ } 


通常 这 两 条 语句 合并 成 一 条 语句 ， 如 下 所 示 : 
if age, ok := ages["bob"]; !ok { /* ... */ } 


通过 这 种 下 标 方式 访问 map 中 的 元 素 输出 两 个 值 ， 第 二 个 值 是 一 个 布尔 值 ， 用 来 报告 
该 元 素 是 否 存在 。 这 个 布尔 变量 一 般 叫 作 ok， 尤 其 是 它 立即 用 在 if 条 件 判断 中 的 时 候 。 
和 slice 一 样 ，map 不 可 比较 ， 唯 一 合法 的 比较 就 是 和 nil 做 比较 。 为 了 判断 两 个 map 
是 否 拥有 相同 的 键 和 值 ， 必 须 写 一 个 循环 : 
func equal(x, y map[string]int) bool { 
if len(x) != len(y) { 


return false 


} 
for k, xv := range x { 
if yv, ok := y[k]; !ok || yv != xv { 
return false 


} 


return true 


} 


注意 我 们 如 何 使 用 !ok 来 区 分 “元 素 不 存在 ”和 “元 素 存在 但 值 为 零 ” 的 情况 。 如 果 我 
们 简单 地 写成 了 xv != y[k]， 那 么 下 面 的 调用 将 错误 地 报告 两 个 map 是 相等 的 。 

// 如 果 equal 函数 写法 错误 ,结果 为 True 

equal(map[string]int{"A": 8@}, map[string]int{"B": 42}) 

Go 没有 提供 集合 类 型 ， 但 是 既然 map 的 键 都 是 唯一 的 ， 就 可 以 用 map 来 实现 这 个 功 
能 。 为 了 模拟 这 个 功能 ， 程 序 dedup 读 取 一 系列 的 行 ， 并 且 只 输出 每 个 不 同行 一 次 。 这 个 是 
1.3 市 演示 过 的 dup 程序 的 变 体 。 程 序 dedup 使 用 map 的 键 来 存储 这 些 已 经 出 现 过 的 行 ， 来 
确保 接 下 来 出 现 的 相同 行 不 会 输出 。 
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gop1. io/ch4/dedup 
func main() { 
seen := make(map[string]bool) // 字符 串 集合 
input := bufio.NewScanner(os.Stdin) 
for input.Sscan() { 
line := input.Text() 
if !seen[line] { 
seen[line] = true 
fmt.Println(line) 


: 

» 

if err := input.Err(); err != nil { 
fmt.Fprintf(os.Stderr, "dedup: %v\n", err) 
os.Exit(1) 

} 


} 


Go 程序 员 通 常 把 这 种 使 用 map 的 方式 描述 成 字符 串 集 合 ， 但 是 请 注意 ， 并 不 是 所 有 的 
map[string]bool 都 是 简单 的 集合 ， 有 一 些 map 的 值 会 同时 包含 true 和 false 的 情况 。 

有 时 候 ， 我 们 需要 一 个 map 并 且 需 求 它 的 键 是 slice， 但 是 因为 map 的 键 必须 是 可 以 比较 
的 ， 所 以 这 个 功能 无 法 直接 实现 。 然 而 ， 我 们 可 以 分 两 步 来 做 。 首 先 ， 定义 一 个 帮助 函数 k 将 
每 一 个 键 都 映射 到 字符 串 ， 当 且 仅 当 x 和 y 相等 的 时 候 ， 我们 才 认 为 k(x) == k(y)。 然 后 ， 就 
可 以 创建 一 个 map, map 的 键 是 字符 串 类 型 ， 在 每 个 键 元 素 被 访问 的 时 候 ， 调 用 这 个 帮助 函数 。 

下 面 的 例子 通过 一 个 字符 串 列表 使 用 一 个 map 来 记录 Add 函数 被 调用 的 次 数 。 帮 助 函 数 
使 用 fmt.sprintf 来 将 一 个 字符 串 slice 转换 为 一 个 适合 做 map 键 的 字符 串 ， 使 用 %q 来 格式 
化 slice 并 记录 每 个 字符 串 的 边界 。 

var m = make(map[string]int) 

func k(list []string) string { return fmt.Sprintf("%q", list) } 


func Add(list []string) { mfk(list)]++ } 
func Count(list []string) int { return m[k(list)] } 


同样 的 方法 适用 于 任何 不 可 直接 比较 的 键 类 型 ， 不 仅仅 局 限于 slice。 甚 至 有 的 时 候 ， 
你 不 想 让 键 通过 == 来 比较 相等 性 ， 而 是 自 定义 一 种 比较 方法 ， 例 如 字符 串 不 区 分 大 小 写 的 
比较 。 同 样 k(x) 的 类 型 不 一 定 是 字符 串 类 型 ， 任 何 能 够 得 到 想 要 的 比较 结果 的 可 比较 类 型 
都 可 以 ， 例 如 整数 、 数 组 或 者 结构 体 。 

这 里 还 有 一 个 关于 map 的 例子 ， 一 个 统计 输入 中 Unicode 代码 点 出 现 次 数 的 程序 。 虽 
然 存 在 着 大 量 可 能 的 字符 ， 但 是 在 一 篇 文档 中 仅 会 有 这 个 巨大 字符 集 的 一 部 分 ， 所 以 很 自然 
地 使 用 map 来 追踪 每 个 字符 出 现 的 次 数 。 
gopl.io/ch4/charcount 


// charcount 计算 Unicode 字符 的 个 数 
package main 





import ( 
"bufio" 


"unicode" 
"unicode/utf8" 
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func main() { 
counts := make(map[rune]int) // Unicode 字符 数量 
var utflen [utf8.UTFMax + 1]int // UTF-8 编码 的 长 度 


invalid := 6 // 非法 UTF-8 字符 数量 
in := bufio.NewReader(os.Stdin) 
for { 
r，n，err := in.ReadRune() // 返回 rune、nbytes、error 
if err == io.EOF { 
break 
} 
if err l= nil { 
fmt.Fprintf(os.Stderr，"charcount: %v\n", err) 
os.Exit(1) 
要 
if r == unicode.ReplacementChar && n == 1 { 
invalid++ 
continue 
} 
counts[r]++ 
utflen[n]++ 
} 
fmt.Printf("rune\tcount\n") 
for c, n := range counts { 
fmt.Printf("%q\t%d\n", c, n) 
} 
fmt.Print("\nlen\tcount\n") 
for i, n := range utflen { 


ifi>e6tf 
fmt.Printf("%d\t%d\n", i, n) 
} 


if invalid > 6 { 
fmt.Printf("\n%d invalid UTF-8 characters\n", invalid) 
} 
} 


函数 ReadRune 解码 UTF-8 编码 ， 并 返回 三 个 值 : 解码 的 字符 、UTF-8 编码 中 字 节 的 长 
度 和 错误 值 。 这 里 唯一 可 能 出 现 的 错误 是 文件 结束 (EOF )。 如 果 输 入 的 不 是 合法 的 UTF-8 
字符 ， 那 么 返回 的 字符 是 code.ReplacementChar 并 且 长 度 是 1。 

charcount 程序 还 输出 了 UTF-8 编码 长 度 出 现 的 次 数 ， 这 个 时 候 map 不 再 是 一 个 合适 的 
数据 类 型 ， 因 为 编码 的 长 度 是 变化 的 ， 一 个 字符 对 应 的 字 节 长 度 可 能 值 从 1 到 utfs.uTFwax 
(这 里 是 4 ) 各 不 相同 ， 所 以 这 个 时 候 使 用 数组 使 程序 更 加 精简 一 点 。 

作为 一 个 实验 ， 我 们 对 本 书 运行 了 一 次 charcount 程序 ， 虽 然 本 书 英文 版 内 容 大 多 数 是 
英文 ， 但 是 也 确实 包含 一 些 非 ASCII 字符 ， 这 里 是 最 多 的 10 个 非 ASCII 字符 : 


”27 世 15 界 14 6 13*10 < 5 x5 国 4964D3 


这 里 是 UTF-8 编码 长 度 的 分 布 : 


len count 
765391 
2 66 

3 70 

4 0 


map 的 值 类 型 本 身 可 以 是 复合 数据 类 型 ， 例 如 map 或 slice。 在 下 面 的 代码 中 ， 变 量 
graph 的 键 类 型 是 string 类 型 ; 值 类 型 是 map 类 型 map[stringJboo1， 表 示 一 个 字符 串 集合 。 
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因此 ，graph 建立 了 一 个 从 字符 串 到 字符 串 集合 的 映射 。 
gopl1.io/ch4/graph 
var graph = make(map[string]map[string]bool) 


func addEdge(from, to string) { 
edges := graph[from] 
if edges == nil { 
edges = make(map[string]bool) 
graph[from] = edges 


和 
edges[to] = true 


func hasEdge(from，to string) bool { 
return graph[from][to] 
} 


函数 addEdge 演示 了 一 种 符合 语言 习惯 的 延迟 初始 化 map 的 方法 ， 当 map 中 的 每 个 键 
第 一 次 出 现 的 时 候 初始 化 。 函 数 hasEdge 演示 了 在 map 中 值 不 存在 的 情况 下 ， 也 可 以 直接 使 
用 。 即 使 from 和 to 都 不 存在 ，graph[from] [to] 也 始终 可 以 给 出 一 个 有 意义 的 值 。 

练习 4.8 : 修改 charcount 的 代码 来 统计 字母 、 数 字 和 其 他 在 Unicode 分 类 中 的 字符 数 
量 ， 可 以 使 用 函数 unicode.IsLetter 等 。 

练习 4.9 : 编写 一 个 程序 wordfreq 来 汇总 输入 文本 文件 中 每 个 单词 出 现 的 次 数 。 在 第 一 
次 调用 scan 之 前 ， 需 要 使 用 input.split(bufio.scanwords) 来 将 文本 行 按照 单词 分 割 而 不 是 
行 分 割 。 


4.4 结构 体 

结构 体 是 将 零 个 或 者 多 个 任意 类 型 的 命名 变量 组 合 在 一 起 的 聚合 数据 类 型 。 每 个 变量 都 
叫 作 结构 体 的 成 员 。 在 数据 处 理 领 域 ， 结 构 体 使 用 的 经 典 实例 是 员工 信息 记录 ， 记 录 中 有 唯 
一 ID、 姓 名 、 地 址 、 出 生日 期 、 职 位 、 薪 水 、 直 属 领 导 等 信息 。 所 有 的 这 些 员工 信息 成 员 
都 作为 一 个 整体 组 合 在 一 个 结构 体 里 面 ， 可 以 复制 一 个 结构 体 ， 将 它 传递 给 函数 ， 作 为 函数 
的 返回 值 ， 将 结构 体 存 储 到 数组 中 ， 等 等 。 

下 面 的 语句 定义 了 一 个 叫 Employee 的 结构 体 和 一 个 结构 体 变 量 dilbert: 


type Employee struct { 


ID int 

Name string 
Address string 
DoB time.Time 


Position string 
Salary int 
ManagerID int 


} 

var dilbert Employee 

dilbert 的 每 一 个 成 员 都 通过 点 号 方式 来 访问 ， 就 像 dilbert.Name 和 dilbert.DoB 这 样 。 
由 于 dilbert 是 一 个 变量 ， 它 的 所 有 成 员 都 是 变量 ， 因 此 可 以 给 结构 体 的 成 员 赋 值 : 

dilbert.Salary -= 5668 // 写 的 代码 太 少 了 ， 降 薪 

或 者 获取 成 员 变 量 的 地 址 ， 然 后 通过 指针 来 访问 它 : 


position := &dilbert.Position 
*position = "Senior ”+ *position // 工作 外 包 给 Elbonia ， 所 以 升 职 
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点 号 同样 可 以 用 在 结构 体 指针 上 : 


var employeeOfTheMonth *Employee = &dilbert 
employeeOfTheMonth.Position += " (proactive team player)" 


后 面 一 条 语句 等 价 于 : 
(*employeeOfTheMonth).Position += " (proactive team player)" 


中 数 EmployeeID 通过 给 定 的 参数 ID 来 返回 一 个 指向 Employee 结构 体 的 指针 。 可 以 用 点 
写 来 访问 它 的 成 员 变量 : 

func EmployeeByID(id int) *Employee pi 

fmt.Println(EmployeeByID(dilbert.ManagerID) .Position) V/ 尖 头 发 的 老板 全 

id := dilbert.1D 

EmployeeByID(id).Salary = 8 // 被 开除 了 …… 不 知道 为 什么 

最 后 一 条 语句 更 新 了 函数 EmployeeID 返回 的 指针 指向 的 结构 体 Employee。 如 果 函 数 
EmployeeID 的 返回 值 类 型 变 成 了 Employee 而 不 是 *Employee， 那 么 代码 将 无 法 通过 编译 ， 因 为 
赋值 表达 式 的 左 侧 无 法 识别 出 一 个 变量 。 

结构 体 的 成 员 变 量 通常 一 行 写 一 个 ， 变 量 的 名 称 在 类 型 的 前 面 ， 但 是 相同 类 型 的 连续 成 
员 变 量 可 以 写 在 一 行 上 ， 就 像 这 里 的 Name 和 Address: 


type Employee struct { 


ID int 

Name, Address string 
DoB time.Time 
Position string 
Salary int 
ManagerID int 


} 

成 员 变 量 的 顺序 对 于 结构 体 同一 性 很 重要 。 如 果 我 们 将 也 是 字符 串 类 型 的 position 和 
Name 、Address 组 合 在 一 起 或 者 互 换 了 Name 和 Address 的 顺序 ， 那么 我 们 就 在 定义 一 个 不 同 的 
结构 体 类 型 。 一 般 来 讲 ， 我 们 只 组 合 相 关 的 成 员 变 量 。 

如 果 一 个 结构 体 的 成 员 变 量 名 称 是 首 字母 大 写 的 ， 那 么 这 个 变量 是 可 导出 的 ， 这 个 是 
Go 最 主要 的 访问 控制 机 制 。 一 个 结构 体 可 以 同时 包含 可 导出 和 不 可 导出 的 成 员 变 量 。 

因为 结构 体 类 型 一 个 成 员 变 量 占据 一 行 ， 所 以 通常 它 的 定义 比较 长 。 虽 然 可 以 在 每 次 需 
要 它 的 时 候 写 出 整个 结构 体 类 型 定义 ， 即 匿名 结构 体 类 型 ， 但 是 重复 的 工作 会 比较 累 ， 所 以 
通常 我 们 会 定义 命名 结构 体 类 型 ， 比 如 Employee。 

命名 结构 体 类 型 s 不 可 以 定义 一 个 拥有 相同 结构 体 类 型 s 的 成 员 变 量 ， 也 就 是 一 个 聚合 
类 型 不 可 以 包含 它 自己 (同样 的 限制 对 数组 也 适用 )。 但 是 s 中 可 以 定义 一 个 s 的 指针 类 型 ， 
即 *s， 这 样 我 们 就 可 以 创建 一 些 递归 数据 结构 ， 比 如 链表 和 树 。 下 面 的 代码 给 出 了 一 个 利 
用 二 又 树 来 实现 插入 排序 的 例子 。 


&opl.io/ch4/treesort 
type tree struct { 
value int 
left, right *tree 
} 


名 尖 头 发 的 老板 (pointy-haired boss) 是 “ 呆 伯 特 ” 系列 漫画 中 的 老板 形象 ， 他 缺乏 一 般 的 常识 以 及 职位 所 要 求 
的 管理 技能 ， 爱 说 大 话 ， 且 富有 向 现实 挑战 的 精神 。 一 一 编辑 注 
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// 就 地 排序 
func Sort(values []int) { 
var root *tree 
for _, v := range values { 
root = add(root, v) 


} 
appendValues(values[:8], root) 
} 
// appendValues 将 元 素 按照 顺序 追加 到 values 里 面 ， 然 后 返回 结果 slice 
func appendvalues(values []int, t *tree) [Jint { 
It js nil 攻 
values = appendValues(values, t.left) 
values = append(values, t.value) 
values = appendValues(values, t.right) 


return values 
} 
func add(t *tree, value int) *tree { 
if t == nil { 
// 等 价 于 返回 &tree{value: value} 
t = new(tree) 
t.value = value 
return t 


} 
if value < t.value { 
t.left = add(t.left, value) 
} else { 
t.right = add(t.right, value) 


return 七 

} 

结构 体 的 零 值 由 结构 体 成 员 的 零 值 组 成 。 通 常情 况 下 ， 我 们 希望 零 值 是 一 个 默认 自然 
的 、 合 理 的 值 。 例 如 ， 在 bytes.Buffer 中 ， 结 构 体 的 初始 值 就 是 一 个 可 以 直接 使 用 的 空 组 
存 。 另 外 ， 第 9 章 将 讲 到 的 sync.Mutex 也 是 一 个 可 以 直接 使 用 且 未 锁定 状态 的 互 斥 锁 。 有 时 
候 ， 这 种 合理 的 初始 值 实现 简单 ， 但 是 有 时 候 也 需要 类 型 的 设计 者 花费 时 间 来 进行 设计 。 

没有 任何 成 员 变 量 的 结构 体 称 为 空 结构 体 ， 写 作 struct{}。 它 没有 长 度 ， 也 不 携带 任何 
信息 ， 但 是 有 的 时 候 会 很 有 用 。 有 一 些 Go 程序 员 用 它 来 替代 被 当 作 集合 使 用 的 map 中 的 布 
尔 值 ， 来 强调 只 有 键 是 有 用 的 ， 但 由 于 这 种 方式 节约 的 内 存 很 少 并 且 语法 复杂 ， 所 以 一 般 尽 
量 避 免 这 样 用 。 | 

seen := make(map[string]struct{}) // 字符 串 集合 
if .人 := seen[s]; !ok { 


seen[s] = struct{}{} 
/Y 首次 出 更 对 


4.4.1 结构 体 字 面 量 
结构 体 类 型 的 值 可 以 通过 结构 体 字 面 量 来 设置 ， 即 通过 设置 结构 体 的 成 员 变量 来 设置 。 
type Point struct{ xX, Y int }: 
p := Point{1, 2} 


有 两 种 格式 的 结构 体 字面 量 。 第 一 种 格式 如 上 ， 它 要 求 按照 正确 的 顺序 ， 为 每 个 成 员 变 
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量 指定 一 个 值 。 这 会 给 开发 和 阅读 代码 的 人 增加 负担 ， 因 为 他 们 必须 记 住 每 个 成 员 变量 的 顺 
序 ， 另 外 这 也 使 得 未 来 结构 体 成 员 变量 扩充 或 者 重新 排列 的 时 候 代 码 维护 性 差 。 所 以 ， 这 种 
格式 一 般 用 在 定义 结构 体 类 型 的 包 中 或 者 一 些 有 明显 的 成 员 变量 顺序 约定 的 小 结构 体 中 ， 比 
如 image.Point{x，y]} 或 者 color .RGBAfred，green，blue，alphaj。 

我 们 用 得 更 多 的 是 第 二 种 格式 ， 通 过 指定 部 分 或 者 全 部 成 员 变 量 的 名 称 和 值 来 初始 化 结 
构 体 变量 ， 就 像 1.4 节 讲述 的 Lissajous 程序 那样 : 


anim := gif.GIF{LoopCount: nframes} 


如 果 在 这 种 初始 化 方式 中 某 个 成 员 变量 没有 指定 ， 那 么 它 的 值 就 是 该 成 员 变 量 类 型 的 堆 
值 。 因 为 指定 了 成 员 变量 的 名 字 ， 所 以 它们 的 顺序 是 无 所 谓 的 。 

这 两 种 初始 化 方式 不 可 以 混合 使 用 ， 另 外 也 无 法 使 用 第 一 种 初始 化 方式 来 绕 过 不 可 导出 
变量 无 法 在 其 他 包 中 使 用 的 规则 。 


package p 


type T struct{ a，b int } // a 和 b 都 是 不 可 导出 的 

package 9q 

import "p" 

var _ = p.T{fa: 1，b: 2} // 编译 错误 ， 无 法 引用 a、b 

var _ = p.T{1, 2} // 编译 错误 ,无 法 引用 a、b 

虽然 上 面 的 最 后 一 行 代码 没有 显 式 地 提 到 不 可 导出 变量 , 但 是 它们 被 隐 式 地 引用 了 ， 所 
以 这 也 是 不 允许 的 。 


结构 体 类 型 的 值 可 以 作为 参数 传递 给 函数 或 者 作为 函数 的 返回 值 。 例 如 ， 下 面 的 函数 将 
Point 缩放 了 一 个 比率 : 


func Scale(p Point, factor int) Point { 
return Point{p.X * factor, p.Y * factor} 
} 


fmt.Println(Scale(Point{1, 2}, 5)) // "{5 10}" 


出 于 效率 的 考虑 ， 大 型 的 结构 体 通常 都 使 用 结构 体 指针 的 方式 直接 传递 给 函数 或 者 从 函 
数 中 返回 。 


func Bonus(e *Employee, percent int) int { 
return e.Salary * percent / 166 


} 
这 种 方式 在 函数 需要 修改 结构 体内 容 的 时 候 也 是 必需 的 ， 在 Go 这 种 按 值 调用 的 语言 
中 ， 调 用 的 函数 接收 到 的 是 实 参 的 一 个 副本 ， 并 不 是 实 参 的 引用 。 


func AwardAnnualRaise(e *Employee) { 
e.Salary = e.Salary * 165 / 166 
} 


由 于 通常 结构 体 都 通过 指针 的 方式 使 用 ， 因 此 可 以 使 用 一 一 种 简单 的 方式 来 创建 、 初始 化 
一 个 struct 类 型 的 变量 并 获取 它 的 地 址 : 

pp := &Point{1, 2} 

这 个 等 价 于 : 


pp := new(Point) 
*pp = Point{1, 2} 


地 
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但 是 apoint{1,2} 这 种 方式 可 以 直接 使 用 在 一 个 表达 式 中 ， 例 如 函数 调用 。 


4.4.2 ”结构 体 比 较 


如 果 结 构 体 的 所 有 成 员 变 量 都 可 以 比较 ， 那 么 这 个 结构 体 就 是 可 比较 的 。 两 个 结构 体 的 
比较 可 以 使 用 == 或 者 !=。 其 中 == 操作 符 按照 顺序 比较 两 个 结构 体 变量 的 成 员 变量 ， 所 以 下 
面 的 两 个 输出 语句 是 等 价 的 : 


type Point struct{ xX, Y int } 


p := Point{1, 2} 
q := Point{2, 1} 
fmt.Println(p.X == q.X && p.Y == q.Y) // "false" 
fmt.Println(p == q) // "false" 


和 其 他 可 比较 的 类 型 一 样 ， 可 比较 的 结构 体 类 型 都 可 以 作为 map 的 键 类 型 。 


type address struct { 
hostname string 
port int 

} 


hits := make(map[address]int) 
hits[address{"golang.org", 443}]++ 


4.4.3 ”结构 体 嵌 套 和 匿名 成 员 


本 节 将 讨论 Go 中 不 同 寻 常 的 结构 体 谋 套 机 制 ， 这 个 机 制 可 以 让 我 们 将 一 个 命名 结构 体 
当 作 另 一 个 结构 体 类 型 的 匿名 成 员 使 用 ; 并 提供 了 一 种 方便 的 语法 ,使 用 简单 的 表达 式 ( 比 
如 x.f) 就 可 以 代表 连续 的 成 员 (比如 x.d.e.f)。 

想象 一 下 2D 绘图 程序 中 会 提供 的 关于 形状 的 库 ， 比 如 矩形、 椭圆 、 星 形 和 和 车轮 形 。 这 
里 定义 了 其 中 可 能 存在 的 两 个 类 型 : 


type Circle struct { 
X, Y, Radius int 

} 

type Wheel struct { 


X, Y, Radius, Spokes int 
} 


Circle 类 型 定义 了 圆心 的 坐标 X 和 Y， 另 外 还 有 一 个 半径 Radius。wheel 类 型 拥有 circle 类 
型 的 所 有 属性 ， 另 外 还 有 一 个 spokes 属性 ， 即 车 轮 中 条 辐 的 数量 。 创 建 一 个 wheel 类 型 的 对 象 : 


var w Wheel 
W.X=8 

W.Y= 8 
w.Radius = 5 
w.Spokes = 26 


在 需要 支持 的 形状 变 多 之 后 ， 我 们 将 意识 到 它们 之 间 的 相似 性 和 重复 性 。 所 以 ， 很 自然 
地 ， 我 们 会 重 构 相 同 的 部 分 : 
type Point struct { 


X，Y int 
} 
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type Circle struct { 
Center Point 
Radius int 


} 


type Wheel struct { 
Circle Circle 
Spokes int 

} 


这 个 程序 看 上 去 变 得 更 清晰 了 ,但 是 访问 wheel 的 成 员 变 麻烦 了 : 


var w Wheel 
w.Circle.Center.X 
w.Circle.Center.Y 
w.Circle.Radius = 
w.Spokes = 26 
Go 允许 我 们 定义 不 带 名 称 的 结构 体 成 员 ， 只 需要 指定 类 型 即 可 ; 这 种 结构 体 成 员 称 
做 匿名 成 员 。 这 个 结构 体 成 员 的 类 型 必须 是 一 个 命名 类 型 或 者 指向 命名 类 型 的 指针 。 下 面 
的 circle 和 wheel 都 拥有 一 个 匿名 成 员 。 这 里 称 Point 被 藤 套 到 circle 中 ，circle 被 伦 套 到 


Wheel 中 。 


type Circle struct { 


Point 
Radius int 
} 
type Wheel struct { 
Circle 
Spokes int 
} 


正 因为 有 了 这 种 结构 体 嵌 套 的 功能 ， 我 们 才能 直接 访问 到 我 们 需要 的 变量 而 不 是 指定 一 
大 串 中 间 变量 : 

var W Wheel 

WwW.X = 8 // 等 价 于 w.Circle.Point.X = 

w.Y = 8 // 等 价 于 w.Circle.Point.Y = 


W.Radius = 5  // 等 价 于 w.Circle.Radius = 5 
w.Spokes = 26 


上 面 注释 里 面 的 方式 也 是 正确 的 ， 但 是 使 用 “匿名 成 员 ” 的 说 法 或 许 不 合适 。 上 面 的 结 
构 体 成 员 circle 和 point 是 有 名 字 的 ， 就 是 对 应 类 型 的 名 字 ， 只 是 这 些 名 字 在 点 号 访问 变量 
时 是 可 选 的 。 当 我 们 访问 最 终 需 要 的 变量 的 时 候 可 以 省 略 中 间 所 有 的 匿名 成 员 。 

遗憾 的 是 ， 结 构 体 字 面 量 并 没有 什么 快捷 方式 来 初始 化 结构 体 ， 所 以 下 面 的 语句 是 无 法 
通过 编译 的 : 

= Wheel{8，8，5，26} // 编译 错误 ， 未 知 成 员 变量 

Ww = Wheel{X: 8，Y: 8，Radius: 5，Spokes: 26} // 编译 错误 ， 未 知 成 员 变 量 

结构 体 字面 量 必须 遵循 形状 类 型 的 定义 ， 所 以 我 们 使 用 下 面 的 两 种 方式 来 初始 化 ， 这 两 
种 方式 是 等 价 的 : 


gop1.io/ch4/embed 
w = Wheel{Circle{fPoint{8, 8}, 5}, 20} 


8 
8 


苑 4 间 


w = Wheel{ 
Circle: Circle{ 
Point: Point{X: 8, Y: 8}, 
Radius: 5， 


}, 
Spokes: 28，// 注意 ， 尾 部 的 逗号 是 必需 的 (Radius 后 面 的 逗号 也 一 样 ) 
} 
fmt.Printf("%#v\n", w) 
// 输出 
// Wheel{Circle:Circle{Point:Point{X:8, Y:8}, Radius:5}, Spokes:28} 
WwW.X = 42 
fmt.Printf("%#v\n", w) 
// 输出 
// Wheel{Circle:Circle{Point:Point{X:42, Y:8}, Radius:5}, Spokes:20} 
注意 副词 # 如 何 使 得 Printf 的 格式 化 符号 %v 以 类 似 Go 语法 的 方式 输出 对 象 ， 这 个 方 
式 里 面包 含 了 成 员 变 量 的 名 字 。 
因为 “匿名 成 员 ” 拥 有 隐 式 的 名 字 ， 所 以 你 不 能 在 一 个 结构 体 里 面 定 义 两 个 相同 类 型 的 
匿名 成 员 ， 否 则 会 引起 冲突 。 由 于 匿名 成 员 的 名 字 是 由 它们 的 类 型 决定 的 ， 因 此 它们 的 可 导 
出 性 也 是 由 它们 的 类 型 决定 的 。 在 上 面 的 例子 中 ，Point 和 circle 这 两 个 匿名 成 员 是 可 导出 
的 。 即 使 这 两 个 结构 体 是 不 可 导出 的 (point 和 circle)， 我 们 仍然 可 以 使 用 快捷 方式 : 


W.X = 8 // 等 价 于 w.circle.point.X = 8 


但 是 注释 中 那 种 显 式 指定 中 间 匿 名 成 员 的 方式 在 声明 circle 和 point 的 包 之 外 是 不 允许 
的 ， 因 为 它们 是 不 可 导出 的 。 

到 目前 为 止 ， 我 们 所 看 到 关于 结构 体内 套 的 使 用 ， 仅 仅 是 关于 点 号 访问 匿名 成 员 内 部 变 
量 的 语法 糖 。 后 面 我 们 将 了 解 到 匿名 成 员 不 一 定 是 结构 体 类 型 ， 任 何 命名 类 型 或 者 指向 命名 
类 型 的 指针 都 可 以 。 不 过 话说 回来 ， 骨 套 一 个 没有 子 成 员 的 类 型 有 什么 用 呢 ? 

以 快捷 方式 访问 匿名 成 员 的 内 部 变量 同样 适用 于 访问 匿名 成 员 的 内 部 方法 。 因 此 ， 外 转 
的 结构 体 类 型 获取 的 不 仅 是 匿名 成 员 的 内 部 变量 ， 还 有 相关 的 方法 。 这 个 机 制 就 是 从 简单 类 
型 对 象 组 合成 复杂 的 复合 类 型 的 主要 方式 。 在 Go 中 ， 组 合 是 面向 对 象 编 程 方式 的 核心 ， 这 
将 在 6.3 节 进 一 步 讲述 。 


4.5 JSON 


JavaScript 对 象 表示 法 (JSON) 是 一 种 发 送 和 接收 格式 化 信息 的 标准 。JSON 不 是 唯一 
的 标准 ，XML ( 见 7.14 节 )、ASN.1 和 Google 的 Protocol Buffer 都 是 相似 的 标准 ， 各 自 有 
适用 的 场景 。 但 是 因为 JSON 的 简单 、 可 读 性 强 并 且 支 持 广泛 ， 所 以 使 用 得 最 多 。 

Go 通过 标准 库 encoding/json 、encoding.xml、encoding/asnl 和 其 他 的 库 对 这 些 格式 的 编 
码 和 解码 提供 了 非常 好 的 支持 ， 这 些 库 都 拥有 相同 的 API。 本 节 对 使 用 最 多 的 encoding/json 
做 一 个 简要 的 描述 。 

JSON 是 JavaScript 值 的 Unicode 编码 ， 这 些 值 包括 字符 串 、 数 字 、 布 尔 值 、 数 组 和 对 
象 。JSON 是 基本 数据 类 型 和 复合 数据 类 型 的 一 种 高 效 的 、 可 读 性 强 的 表示 方法 。 第 3 章 讲 
解 了 基础 数据 类 型 ， 本 章 讲解 了 复合 数据 类 型 一 一 数组 、slice、 结 构 体 和 map。 

JSON 最 基本 的 类 型 是 数字 (以 十 进 制 或 者 科学 计数 法 表示 )、 布 尔 值 (true 或 false) 和 
字符 串 。 字 符 串 是 用 双 引 号 括 起 来 的 Unicode 代码 点 的 序列 ， 使 用 反 斜 杠 作为 转 义 字 符 ， 通 
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过 和 Go 类 似 的 方式 访问 成 员 。 当 然 ，JSON 里 面 的 \uhhh 数字 转 义 得 到 的 是 UTF-16 编码 ， 
而 不 是 Go 里 面 的 字符 。 

这 些 基础 类 型 可 以 通过 JSON 的 数组 和 对 象 进行 组 合 。JSON 的 数组 是 一 个 有 序 的 元 素 
序列 ， 每 个 元 素 之 间 用 逗号 分 隔 ， 两 边 使 用 方 括号 括 起 来 。JSON 的 数组 用 来 编码 Go 里 面 
的 数组 和 slice。JSON 的 对 象 是 一 个 从 字符 串 到 值 的 映射 ， 写 成 name:value 对 的 序列 ， 每 个 
元 素 之 间 用 逗号 分 隔 ， 两 边 使 用 花 括号 括 起 来 。JSON 的 对 象 用 来 编码 Go 里 面 的 map ( 键 
为 字符 串 类 型 ) 和 结构 体 。 例 如 : 





boolean true 
number -273..15 
string "She said \"Hello， 世 界 \"" 
array ， ["gold", "silver", "bronze"] 
object {"year": 1986， 

"event": "archery", 


"medals": ["gold", "silver", "bronze"]} 


想象 一 个 程序 需要 收集 电影 的 观看 次 数 并 提供 推荐 。 这 个 程序 的 Movie 类 型 和 典型 的 元 
素 列 表 都 在 下 面 提供 了 。( 结 构 体 中 成 员 Year 和 color 后 面 的 字符 串 字面 量 是 成 员 的 标签 ， 
稍 后 会 讲解 它 。) 


gopl.io/ch4/movie 
type Movie struct { 
Title string 
Year int “json:"released". 
Color bool “json:"color,omitempty". 
Actors []string 


var movies = [J]Movief 
{Title: "Casablanca", Year: 1942, Color: false, 
Actors: []string{"Humphrey Bogart", "Ingrid Bergman"}}, 
{Title: "Cool Hand Luke", Year: 1967, Color: true, 
Actors: []string{"Paul Newman"}}, 
{Title: "Bullitt", Year: 1968, Color: true, 
Actors: []string{"Steve McQueen", "Jacqueline Bisset"}}, 
A eis 
} 


这 种 类 型 的 数据 结构 体 最 适合 JSON， 无 论 是 从 Go 对 象 转 为 JSON 还 是 从 JSON 转换 
为 Go 对 象 都 很 容易 。 把 Go 的 数据 结构 (比如 movies) 转换 为 JSON 称 为 marshal。marshal 
是 通过 json.Marshal 来 实现 的 : 


data, err := json.Marshal(movies) 
if err != nil { 
log.Fatalf("JSON marshaling failed: %s", err) 


fmt.Printf("%s\n", data) 


Marshal 生成 了 一 个 字 节 slice， 其 中 包含 一 个 不 带 有 任何 多 余 空 白字 符 的 很 长 的 字符 串 。 
把 生成 的 结果 折 释 一 下 放 在 这 里 : 


[{"Title":"Casablanca", "released":1942, "Actors":["Humphrey Bogart", "Ingr 
id Bergman"]},{"Title":"Cool Hand Luke", "released":1967,"color":true, "Ac 
tors":["Paul Newman"]},{"Title":"Bullitt", "released":1968,"color":true,”" 
Actors":["Steve McQueen","Jacqueline Bisset"]}] 


这 种 紧凑 的 表示 方法 包含 了 所 有 的 信息 但 是 难以 阅读 。 为 了 方便 阅读 ， 有 一 个 json. 
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MarshalIndent 的 变 体 可 以 输出 整齐 格式 化 过 的 结果 。 这 个 函数 有 两 个 参数 ， 一 个 是 定义 每 行 
输出 的 前 缀 字符 串 ， 另 外 一 个 是 定义 缩 进 的 字符 串 。 


data，err := json.MarshalIndent(movies, "", " 3 ) 
if err l= nil { 
log.Fatalf("JSON marshaling failed: %s", err) 


} 
fmt.Printf("%s\n", data) 


上 面 的 代码 输出 : 


[ 
. 
"Title": "Casablanca", 
"released": 1942， 
"Actors": [ 
"Humphrey Bogart", 
"Ingrid Bergman" 
] 
}, 


"Title": "Cool Hand Luke", 
"released": 1967， 
"color": true, 
"Actors": [ 
"Paul Newman" 


] 
}, 


"Titlen sr "Bullitt"s 
"released": 1968, 
"color": true, 
"Actors": [ 
"Steve McQueen", 
"Jacqueline Bisset" 
] 
} 
] 


marshal 使 用 Go 结构 体 成 员 的 名 称 作 为 JSON 对 象 里 面 字段 的 名 称 (通过 反射 的 方式 ， 
这 将 在 12.6 节 中 介绍 )。 只 有 可 导出 的 成 员 可 以 转换 为 JSON 字段 ， 这 就 是 为 什么 我 们 将 
Go 结构 体 里 面 的 所 有 成 员 都 定义 为 首 字母 大 写 的 。 

你 或 许 注意 到 了 ， 上 面 的 结构 体 成 员 Year 对 应 地 转换 为 released， 男 外 color 转换 为 
color。 这 个 是 通过 成 员 标 签 定义 (field tag) 实现 的 。 成 员 标 签 定 义 是 结构 体 成 员 在 编译 期 
间 关 联 的 一 些 元 信息 : 


Year int ‘json:"released". 
Color bool ‘json:"color,omitempty" 


成 员 标签 定义 可 以 是 任意 字符 串 ， 但 是 按照 习惯 ， 是 由 一 串 由 空格 分 开 的 标签 键 值 
对 key:"value" 组 成 的 ; 因为 标签 的 值 使 用 双 引 号 括 起 来 ， 所 以 一 般 标 签 都 是 原生 的 字符 串 
字面 量 。 键 json 控制 包 encoding/json 的 行为 ， 同 样 其 他 的 encoding/.… 包 也 遵循 这 个 规 
则 。 标 签 值 的 第 一 部 分 指定 了 Go 结构 体 成 员 对 应 JSON 中 字段 的 名 字 。 成 员 的 标签 通常 这 
样 使 用 ， 比 如 total_count 对 应 Go 里 面 的 Totalcount。Color 的 标签 还 有 一 个 额外 的 选项 ， 
omitempty， 它 表示 如 果 这 个 成 员 的 值 是 零 值 或 者 为 空 ， 则 不 输出 这 个 成 员 到 JSON 中 。 所 
以 ， 对 于 《 Casablanca 》 这 部 黑白 电影 ， 就 没有 输出 成 员 color 到 JSON 中 。 
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marshal 的 逆 操 作 将 JSON 字符 串 解码 为 Go 数据 结构 ， 这 个 过 程 叫 作 unmarshal， 这 个 
是 由 json.Unmarshal 实现 的 。 下 面 的 代码 将 电影 的 JSON 数据 转换 到 结构 体 slice 中 ， 这 个 结 
构 体 唯 一 的 成 员 就 是 Title。 通 过 合理 地 定义 Go 的 数据 结构 ， 我 们 可 以 选择 将 哪 部 分 JSON 
数据 解码 到 结构 体 对 象 中 ， 哪 些 数据 可 以 丢弃 。 当 函数 unmarshal 调用 完成 后 ， 它 将 填充 结 
构 体 slice 中 Title 的 值 ，JSON 中 其 他 的 字段 就 丢弃 了 。 


var titles []struct{ Title string } 
if err := json.Unmarshal(data, &titles); err != nil { 
log.Fatalf("JSON unmarshaling failed: %s", err) 


fmt.Println(titles) // "[{Casablanca} {Cool Hand Luke} {Bullitt}]" 


很 多 的 Web 服务 都 提供 JSON 接口 ， 通 过 发 送 HTTP 请 求 来 获取 想 要 得 到 的 JSON 信 
息 。 我 们 通过 查询 GitHub 提供 的 issue 跟踪 接口 来 演示 一 下 。 首 先 ， 要 定义 需要 的 类 型 和 
常量 : 
gopl. io/ch4/github 
// 包 github 提供 了 GitHub issue 跟踪 接口 的 Go API 


// 详细 查看 https://developer.github.com/v3/search/#search-issues. 
package github 


import "time" 
const IssuesURL = "https://api.github.com/search/issues" 


type IssuesSearchResult struct { 
TotalCount int “json:"total _ count". 


Items [J]*Issue 
} 
type Issue struct { 
Number int 
HTMLURL string “json:"html_url". 
Title string 
State string 
User *User 
CreatedAt time.Time “json:"created at". 
Body string // Markdown 格式 
} 


type User struct { 
Login string 
HTMLURL string ‘json:"html_url"™ 
} 
和 前 面 一 样 ， 即 使 对 应 的 JSON 字段 的 名 称 不 是 首 字母 大 写 ， 结 构 体 的 成 员 名 称 也 必须 
首 字 母 大 写 。 由 于 在 unmarshal 阶段 ，JSON 字段 的 名 称 关联 到 Go 结构 体 成 员 的 名 称 是 忽略 
大 小 写 的 ， 因 此 这 里 只 需要 在 JSON 中 有 下 划 线 而 Go 里 面 没 有 下 划 线 的 时 候 使 用 一 下 成 员 
标签 定义 。 同 样 ， 这 里 选择 性 地 对 JSON 中 的 字段 进行 解码 ， 因 为 相对 于 这 里 演示 的 内 容 ， 
GitHub 的 查询 回复 返回 相当 多 的 信息 。 
函数 searchIssues 发 送 HTTP 请 求 并 将 回复 解析 为 JSON。 由 于 用 户 的 查询 请 求 参 
数 中 可 能 存在 一 些 字符 ， 这 些 字符 在 URL 中 是 特殊 字符 ， 比 如 ?或 者 &， 因 此 使 用 url. 
QueryEscape 函数 来 确保 它们 拥有 正确 的 含义 。 


gopl1.io/ch4/github 
package github 
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import ( 
"encoding/json" 
"fmt" 
"net/http" 
"net/url" 
"strings" 


) 


// SearchIssues 函数 查询 GitHub 的 issue 跟踪 接口 
func SearchIssues(terms []string) (*IssuesSearchResult, error) { 
q := Url.QueryEscape(strings.Join(terms, " ")) 
resp, err := http.Get(IssuesURL + "?q=" + 9) 
if err != nil { 
return nil, err 


} 


// 我 们 必须 在 所 有 的 可 能 分 支 上 面 关闭 resp.Body 
// 第 5 章 将 讲述 defer ， 它 可 以 让 代码 简单 一 点 
if resp.StatusCode != http.statusOk { 
resp.Body.Close() 
return nil, fmt.Errorf("search query failed: %s", resp.Status) 


} 


var result IssuesSearchResult 

if err := json.NewDecoder(resp.Body).Decode(&result); err != nil { 
resp.Body.Close() 
return nil, err 


》 
resp.Body.Close() 
return &result, nil 


} 


前 面 的 例子 使 用 了 json.Unmarshal 来 将 整个 字 节 slice 解码 为 单个 JSON 实体 。 这 里 变化 一 
下 ,使 用 流 式 解码 器 ( 即 json.Decoder)， 可 以 利用 ete JSON 实 
体 ， 我 们 现在 还 用 不 到 这 个 功能 。 你 或 许 猜 到 了 ， 也 有 一 个 叫 作 json.Encoder 的 流 式 编码 器 。 
调用 Decode 方法 来 填充 变量 result。 有 各 种 方法 来 将 结果 格式 化 得 好 看 一 点 。 ri 
就 是 使 用 下 面 介 绍 的 关于 issues 命令 的 方法 ， 使 用 固定 宽度 的 表格 ， 下 一 节 将 讨论 一 个 
于 模板 的 复杂 一 点 的 方法 。 
gopl.io/ch4/issues 
// 将 符合 搜索 条 件 的 issue 输出 为 一 个 表格 


package main 


import ( 
"fmt" 
"1og" 
"os" 
"gopl.io/ch4/github" 
) 


func main() { 

result, err := github.SearchIssues(os.Args[1:]) 

if err != nil { 
log.Fatal(err) 

} 

fmt.Printf("%d issues:\n", result.TotalCount) 

for _, item := range result.Items { 
fmt.Printf("#%-5d %9.9s %.55s\n", 

item.Number, item.User.Login, item.Title) 
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命令 行 参数 指定 搜索 的 条 件 ， 该 命令 搜索 Go 项 目的 issue 跟踪 接口 ， 查 找 关 于 JSON 
编码 的 Open 状态 的 bug 列表 。 


$ go build gopl.io/ch4/issues 

$ ./issues repo:golang/go is:open json decoder 

13 issues: 

#5680 eaigner encoding/json: set key converter on en/decoder 

#6656 gopherbot encoding/json: provide tokenizer 

#8658 gopherbot encoding/json: use bufio 

#8462 kortschak encoding/json: UnmarshalText confuses json.Unmarshal 
#5981 rsc encoding/json: allow override type marshaling 

#9812 klauspost encoding/json: string tag not symmetric 

#7872 extempora encoding/json: Encoder internally buffers full output 
#9656 cespare encoding/json: Decoding gives errPhase when unmarshalin 
#6716 gopherbot encoding/json: include field name in unmarshal error me 
#6961 lukescott encoding/json, encoding/xml: option to treat unknown fi 
#6384 joeshaw encoding/json: encode precise floating point integers u 
#6647 btracey x/tools/cmd/godoc: display type kind of each named type 
#4237 gjemiller encoding/base64: URLEncoding padding is optional 


GitHub 的 Web 服务 接口 (https://developer.github.com/v3/) 有 很 多 的 功能 ， 这 里 就 不 
再 乾 述 了 。 

练习 4.10: 修改 issues 实例 ， 按 照 时 间 来 输出 结果 ， 比 如 一 个 月 以 内 ， 一 年 以 内 或 者 
超过 一 年 。 

练习 4.11: 开发 一 个 工具 来 让 用 户 可 以 通过 命令 行 创建 、 读 取 、 更 新 或 者 关闭 GitHub 
的 issues， 当 需要 额外 输入 的 时 候 ， 调 用 他 们 喜欢 的 文本 编辑 器 。 

练习 4.12: 流行 的 Web 漫画 xkcd 有 一 个 JSON 接口 。 例 如 ， 调 用 https://xkcd.com/ 
571/info.6.json 输出 漫画 571 的 详细 描述 ， 这 个 是 很 多 人 最 喜欢 的 之 一 。 下 载 每 一 个 URL 
并 且 构 建 一 个 离线 索引 。 编 写 一 个 工具 xkcd 来 使 用 这 个 索引 ， 可 以 通过 命令 行 指定 的 搜索 
条 件 来 查找 并 输出 符合 条 件 的 每 个 漫画 的 URL 和 剧本 。 

练习 4.13: 基于 JSON 开发 的 Web 服务 ， 开 放电 影 数据 库 让 你 可 以 在 https://omdbapi. 
com/ 上 通过 名 字 来 搜索 电影 并 下 载 海 报 图 片 。 开 发 一 个 poster 工具 以 通过 命令 行 指定 的 电 
影 名 称 来 下 载 海 报 。 


4.6 文本 和 HTML 模板 


上 面 的 例子 仅仅 给 出 了 最 简单 的 格式 化 ， 这 种 情况 下 ，Printf 函数 足够 用 了 。 但 是 有 
的 情况 下 格式 化 会 比 这 个 复杂 得 多 ， 并 且 要 求 格式 和 代码 彻底 分 离 。 这 个 可 以 通过 text/ 
template 包 和 html/template 包 里 面 的 方法 来 实现 ， 这 两 个 包 提 供 了 一 种 机 制 ， 可 以 将 程序 
变量 的 值 代入 到 文本 或 者 HTML 模板 中 。 

模板 是 一 个 字符 串 或 者 文件 ， 它 包含 一 个 或 者 多 个 两 边 用 双 大 括号 包围 的 单元 一 一 
{{.…}}， 这 称 为 操作 。 大 多 数 的 字符 串 是 直接 输出 的 ,但 是 操作 可 以 引发 其 他 的 行为 。 每 
个 操作 在 模板 语言 里 面 都 对 应 一 个 表达 式 ， 提 供 的 简单 但 强大 的 功能 包括 : 输出 值 ， 选 择 结 
构 体 成 员 ， 调 用 函数 和 方法 ,描述 控制 逻辑 (比如 if-else 语句 和 range 循环 )， 实 例 化 其 他 
的 模板 等 。 一 个 简单 的 字符 串 模 板 如 下 所 示 : 


Bopl1.io/ch4/issuesreport 





const templ = `{{.TotalCount}} issues: 

{{range .Items}}------------- 
Number: {{.Number}} 

User: {{.User.Login}} 


泪 
A 
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Title: {{.Title | printf "%.64s"}} 
Age: {{.CreatedAt | daysAgo}} days 
{{end}}- 


模板 首先 输出 符合 条 件 的 issue 数量 ， 然 后 分 别 输出 每 个 issue 的 序号 、 用 户 、 标 题 和 
距离 创建 时 间 已 过 去 的 天 数 。 在 这 个 操作 里 面 ， 有 一 个 表示 当前 值 的 标记 ,用 点 号 (.) 表 
示 。 点 号 最 开始 的 时 候 表示 模板 里 面 的 参数 ， 在 这 个 例子 中 即 是 github.IssuesSearchResult. 
操作 {{.Totalcount}} 代表 Totalcount 成 员 的 值 ， 直 接 输 出 。{{range.Items}} 和 {{end}} 操作 
创建 一 个 循环 ， 所 以 它们 内 部 的 值 会 展开 很 多 次 ， 这 个 时 候 点 号 (.) 表示 Items 里 面 连续 的 
元 素 。 

在 操作 中 ， 符 号 | 会 将 前 一 个 操作 的 结果 当做 下 一 个 操作 的 输入 ， 和 UNIX 的 shell 管 
道 类 似 。 在 Title 的 例子 中 ， 第 二 个 操作 就 是 printf 函数 ， 在 所 有 的 模板 中 ,就 是 内 置 函 数 
fmt.Sprintf 的 同义词 。 对 于 Age 来 说 ， 第 二 个 操作 是 daysAgo， 这 个 函数 使 用 time.since 将 
CreatedAt 转换 为 已 过 去 的 时 间 。 


func daysAgo(t time.Time) int { 
return int(time.Since(t).Hours() / 24) 
} 


注意 ，CreatedAt 的 类 型 是 time.Time 而 不 是 string 类 型 。 同 样 地 ， 一 个 类 型 可 以 定义 方 
法 来 控制 自己 的 字符 串 格式 化 方式 ( 见 2.5 节 )， 另 外 也 可 以 定义 方法 来 控制 自身 JSON 序列 
化 和 反 序 列 化 的 方式 。time.Time 的 JSON 序列 化 值 就 是 该 类 型 标准 的 字符 串 表示 方法 。 

通过 模板 输出 结果 需要 两 个 步 又。 首先 ， 需 要 解析 模板 并 转换 为 内 部 的 表示 方法 ， 然 
后 在 指定 的 输入 上 面 执行 。 解 析 模 板 只 需要 执行 一 次 。 下 面 的 代码 创建 并 解析 上 面 定 义 的 
文本 模板 temp1。 注 意 方法 的 链 式 调用 : template.New 创建 并 返回 一 个 新 的 模板 ，Funcs 添加 
daysAgo 到 模板 内 部 可 以 访问 的 函数 列表 中 ， 然 后 返回 这 个 模板 对 象 ; 最 后 调用 Parse 方法 。 


report，err := template.New("report"). 
Funcs(template.FuncMap{"daysAgo": daysAgo}). 
Parse(templ) 

if err != nil { 
log.Fatal(err) 


由 于 模板 通常 是 在 编译 期 间 就 固定 下 来 的 ， 因 此 无 法 解析 模板 将 是 程序 中 的 一 个 严重 的 
bug。 帮 助 函 数 template.Must 提供 了 一 种 便捷 的 错误 处 理 方式 ， 它 接受 一 个 模板 和 错误 作为 参 
数 ， 检 查 错误 是 否 为 nil (如 果 不 是 nil， 则 宕 机 )， 然 后 返回 这 个 模板 。5.9 节 将 讲述 这 个 方法 。 

一 旦 创建 了 模板 ,添加 了 内 部 可 调用 的 函数 daysAgo， 然 后 解析 ， 再 检查 ， 就 可 以 使 用 
github.IssuessearchResult 作为 数据 源 ， 使 用 os.stdout 作为 输出 目标 执行 这 个 模板 : 


var report = template.Must(template.New("issuelist"). 
Funcs(template.FuncMap{"daysAgo": daysAgo}). 
Parse(templ)) 


func main() { 
result, err := github.SearchIssues(os.Args[1:]) 
if err != nil { 


log.Fatal(err) 

} 

if err := report.Execute(os.Stdout, result); err != nil { 
log.Fatal(err) 


} 
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这 个 程序 输出 一 个 纯 文本 ， 如 下 所 示 : 


$ go build gopl.io/ch4/issuesreport 
$ ./issuesreport repo:golang/go is:open json decoder 
13 issues: 


Number: 5686 

User: eaigner 

Title: encoding/json: set key converter on en/decoder 
Age: 756 days 


Number : 6656 

User: gopherbot 

Title: encoding/json: provide tokenizer 
Age: . 695 days 


我 们 再 来 看 html/template 包 。 它 使 用 和 text/template 包 里 面 一 样 的 API 和 表达 式 语 
句 ， 并 且 额 外 地 对 出 现在 HTML、JavaScript、CSS 和 URL 中 的 字符 串 进行 自动 转 义 。 这 
些 功能 可 以 避免 生成 的 HTML 引发 长 久 以 来 都 会 有 的 安全 问题 ， 比 如 注入 攻击 ， 对 方 利用 
issue 的 标题 来 包含 不 安全 的 代码 ， 在 模板 中 如 果 没 有 合理 地 进行 转 义 ， 会 让 它们 能 够 控制 
整个 页 面 。 

下 面 的 模板 将 issue 输出 为 HTML 的 表格 ， 注 意 导 入 不 同 的 包 : 


gopl.io/ch4/issueshtml 





import "html/template" 


var issueList = template.Must(template.New("issuelist").Parse(. 
<h1>{{.TotalCount}} issues</h1> 
<table> 
<tr style='text-align: left'> 
<th>#</th> 
<th>State</th> 
<th>User</th> 
<th>Tit1le</th> 
</tr> 
{{range .Items}} 
可 站 
<td><a href='{{.HTMLURL}}'>{{.Number}}</a></td> 
<td>{{.State}}</td> 
<td><a href='{{.User.HTMLURL}}'>{{.User.Login}}</a></td> 
<td><a href='{{.HTMLURL}}'>{{.Title}}</a></td> 
</tr> 
{{end}} 
</table> 
3) 


下 面 的 命令 对 查询 的 结果 执行 新 的 模板 ， 这 些 结果 和 上 面 的 稍 许 不 同 : 


$ go build gopl.io/ch4/issueshtml 
$ ./issueshtml repo:golang/go commenter:gopherbot json encoder >issues.html 


图 4-4 显示 了 生成 的 HTML 表格 在 Web 浏览 器 中 的 样子 。 链 接 指向 GitHub 上 面 对 应 的 
页 面 。 
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图 4-4 将 获取 的 Go 项 目的 issue 列表 的 JSON 数据 以 HTML 表格 显示 


土 图 中 issue 的 HTML 信息 显示 没有 问题 ， 但 我 们 可 以 通过 在 issue 标题 中 包含 HTML 
的 元 字符 (比如 & 和 <) 来 看 一 下 效果 。 我 们 选择 了 两 个 issue 来 做 演示 : 


$ ./issueshtml repo:golang/go 3133 16535 >issues2.html 


图 4-5 显示 了 查询 的 结果 。 注 意 ，html/template 包 自 动 将 HTML 元 字符 转 义 ， 这 样 标 
题 才能 显示 正常 。 如 果 我 们 错误 地 使 用 了 text/template 包 ， 那 么 字符 串 “&at; ”将 会 被 当 
做 小 于 号 ““' ， 而 字符 串 "link>" 将 变 成 一 个 link 元 素 ， 这 将 改变 HTML 的 文档 结构 ， 甚 
至 有 可 能 产生 安全 问题 。 

我 们 可 以 通过 使 用 命名 的 字符 串 类 型 [ee@e /Ben 
template.HTML 类 型 而 不 是 字符 串 类 型 避免 模 | 全 
板 自动 转 义 受信 任 的 HTML 数据 。 同 样 的 命 
名 类 型 适用 于 受信 任 的 JavaScript、CSS 和 
URL。 下 面 的 程序 演示 了 相同 数据 在 不 同类 型 
下 的 效果 ,A 是 字符 串 类 型 而 B 是 template. 
HTML 类 型 。 


gop1.io/ch4/autoescape 
func main() { 
const templ = ~ <p>A: {{.A}}</p><p>B: {{.B}}</p> 
t := template.Must(template.New("escape").Parse(templ1)) 
var data struct { 
A string // 不 受信 任 的 纯 文本 
B template.HTML // 受信 任 的 HTML 





全 从 QQ 从 | B file:///home/gopher/issu 


2 issues 





4-5 issue 标题 中 的 HTML 元 字符 正确 地 显示 


} 

data.A = "<b>Hello!</b>" 

data.B = "<b>Hello!l</b>" 

if err := 七 .Execute(os.Stdout，data); err != nil { 
log.Fatal(err) 
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图 4-6 演示 了 这 个 模板 在 浏览 器 中 的 输出 ,我 们 可 以 看 出 来 A 转 义 了 而 B 没有 。 


Dautoescape html x 


€ 人 G MD fle//home/gopher/gobook/autoescape.html 


A: <b>Hellol</b> 


B: Hello! 





图 4-6 字符 串 值 被 HTML 转 义 了 ,但 是 template.HTML 值 没有 


这 里 仅仅 演示 了 模板 系统 最 基本 的 功能 。 如 果 你 希望 获取 更 多 的 信息 ， 可 以 查询 相关 包 
的 文档 。 


$ go doc text/template 
$ go doc html/template 


练习 4.14 : 创建 一 个 Web 服务 器 ， 可 以 通过 查询 GitHub 并 缓存 信息 ， 然 后 可 以 浏览 
bug 列表 、 里 程 碑 信息 以 及 参与 用 户 的 信息 。 
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The Go Programming Language 


了 冰 数 





函数 包含 连续 的 执行 语句 ， 可 以 在 代码 中 通过 调用 函数 来 执行 它们 。 函 数 能 够 将 一 个 复 
杂 的 工作 切 分 成 多 个 更 小 的 模块 ， 使 得 多 人 协作 变 得 更 加 容易 。 另 外 ， 函 数 对 它 的 使 用 者 隐 
藏 了 实现 细节 。 这 几 方 面 的 特性 使 函数 成 为 多 数 编程 语言 的 重要 特性 之 一 。 

我 们 之 前 已 经 见 过 许多 函数 ， 现 在 让 我 们 更 彻底 地 探究 一 下 函数 。 本 章 的 运行 示例 是 一 
个 网 络 疏 虫 ， 它 是 Web 搜索 引擎 的 组 件 之 一 ， 负 责 抓 取 网 页 并 分 析 页 面包 含 的 链接 ， 将 链 
接 指向 的 页 面 也 抓 取 下 来 ， 循 环 往复 。 利 用 网 络 疏 虫 的 实现 ， 我 们 可 以 更 充分 地 了 解 到 Go 
语言 的 递归 、 匿 名 函数 、 错 误 处 理 等 方面 的 函数 特性 。 


5.1 函数 声明 

每 个 函数 声明 都 包含 一 个 名 字 、 一 个 形 参 列表 、 一 个 可 选 的 返回 列表 以 及 函数 体 : 

func name(parameter-1list) (result-1list) { 

body 

上 

形 参 列表 指定 了 一 组 变量 的 参数 名 和 参数 类 型 ， 这 些 局 部 变量 都 由 调用 者 提供 的 实 参 传 
递 而 来 。 返 回 列 表 则 指定 了 函数 返回 值 的 类 型 。 当 函数 返回 一 个 未 命名 的 返回 值 或 者 没有 
返回 值 的 时 候 ， 返 回 列表 的 圆 括号 可 以 省 略 。 如 果 一 个 函数 既 省 略 返回 列表 也 没有 任何 返回 
值 ， 那 么 设计 这 个 函数 的 目的 是 调用 函数 之 后 所 带 来 的 附加 效果 。 在 下 面 的 hbypot 函数 中 : 


func hypot(x, y float64) float64 { 
return math.Sqrt(x*x + y*y) 
} 


fmt.Println(hypot(3, 4)) // "5" 


x 和 y 是 函数 声明 中 的 形 参 ，3 和 4 是 调用 函数 时 的 实 参 ,并且 函数 返回 一 个 类 型 为 
float64 的 值 。 | 

返回 值 也 可 以 像 形 参 一 样 命名 。 这 个 时 候 ， 每 一 个 命名 的 返回 值 会 声明 为 一 个 局 部 变 
量 ， 并 根据 变量 类 型 初始 化 为 相应 的 0 值 。 

当 函 数 存在 返回 列表 时 ， 必 须 显 式 地 以 return 语句 结束 ， 除 非 函 数 明 确 不 会 走 完整 个 
执行 流程 ， 比 如 在 函数 中 抛 出 宕 机 异常 或 者 函数 体内 存在 一 个 没有 break 退出 条 件 的 无 限 
for 循环 。 

在 hypot 函数 中 使 用 到 一 种 简写 ， 如 果 几 个 形 参 或 者 返回 值 的 类 型 相同 ， 那 么 类 型 只 需 
要 写 一 次 。 以 下 两 个 声明 是 完全 相同 的 : 

func f(i, j, k int, s, t string) i 

func f(i int, j int, k int, s string, t string) { /* ... */ } 

下 面 使 用 4 种 方式 声明 一 个 带 有 两 个 形 参 和 一 个 返回 值 的 泡 数 ， 所 有 变量 都 是 int 类 
型 。 空 白 标识 符 用 来 强调 这 个 形 参 在 函数 中 未 使 用 。 
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func add(x int，y int) int { returnx+y} 

func sub(x, y int) (z int) {z= x-y; return} 
func first(x int, _ int) int { return x } 

func zero(int, int) int { return 6 } 


fmt.Printf("%T\n", add)  // “func(int, int) int" 

fmt.Printf("%T\n", sub) // "func(int, int) int" 

fmt.Printf("%T\n", first) // "func(int, int) int" 

fmt.Printf("%T\n", zero) // "func(int, int) int" 

函数 的 类 型 称 作 函数 签名 。 当 两 个 函数 拥有 相同 的 形 参 列表 和 返回 列表 时 ， 认 为 这 两 个 
函数 的 类 型 或 签名 是 相同 的 。 而 形 参 和 返回 值 的 名 字 不 会 影响 到 函数 类 型 ， 采 用 简写 同样 也 
不 会 影响 到 函数 的 类 型 。 

每 一 次 调用 函数 都 需要 提供 实 参 来 对 应 函数 的 每 一 个 形 参 ， 包 括 参 数 的 调用 顺序 也 必须 
一 致 。Go 语言 没有 默认 参数 值 的 概念 也 不 能 指定 实 参 名 ， 所 以 除了 用 于 文档 说 明之 外 ， 形 
参 和 返回 值 的 命名 不 会 对 调用 方 有 任何 影响 。 

形 参 变量 都 是 函数 的 局 部 变量 ， 初 始 值 由 调用 者 提供 的 实 参 传递 。 函 数 形 参 以 及 命名 返 
回 值 同属 于 函数 最 外 层 作用 域 的 局 部 变量 。 

实 参 是 按 值 传递 的 ， 所 以 函数 接收 到 的 是 每 个 实 参 的 副本 ; 修改 函数 的 形 参 变量 并 不 会 
影响 到 调用 者 提供 的 实 参 。 然 而 ， 如 果 提 供 的 实 参 包 含 引 用 类 型 ， 比 如 指针 、slice 、map、 
函数 或 者 通道 ， 那 么 当 函 数 使 用 形 参 变量 时 就 有 可 能 会 间接 地 修改 实 参 变量 。 

你 可 能 偶尔 会 看 到 有 些 函 数 的 声明 没有 函数 体 ， 那 说 明 这 个 函数 使 用 除了 Go 以 外 的 语 
言 实现 。 这 样 的 声明 定义 了 该 函数 的 签名 。 

package math 

func Sin(x float64) float64 // 使 用 汇编 语言 实现 


5.2 递归 

靖 数 可 以 递归 调用 ， 这 意味 着 函数 可 以 直接 或 间接 地 调用 自己 。 递 归 是 一 种 实用 的 技 
术 ， 可 以 处 理 许多 带 有 递归 特性 的 数据 结构 。 在 4.4 节 使 用 递归 实现 了 对 一 棵 树 进行 插入 排 
序 。 本 节 再 一 次 使 用 递归 处 理 HTML 文件 。 

下 面 的 代码 示例 使 用 了 一 个 非 标准 的 包 golang.org/x/net/html， 它 提供 了 解析 HTML 的 
功能 。golang.org/x/… 下 的 仓库 (比如 网 络 、 国 际 化 语言 处 理 、 移 动 平台 、 图 片 处 理 、 加 密 
功能 以 及 开发 者 工具 ) 都 由 Go 团队 负责 设计 和 维护 。 这 些 包 并 不 属于 标准 库 ， 原 因 是 它们 
还 在 开发 当中 ， 或 者 很 少 被 Go 程序 员 使 用 。 

我 们 需要 的 golang.org/x/net/html API 如 下 面 的 代码 所 示 。 函 数 html.parse 读 和 一段 字 
节 序 列 ， 解 析 它 们 ， 然 后 返回 HTML 文档 树 的 根 节点 html.Node。HTML 有 多 种 节点 ， 比 如 
文本 、 注 释 等 。 但 这 里 我 们 只 关心 表单 的 元 素 节点 cname key='value'>。 


golang.org/x/net/html 





package html 


type Node struct { 


Type NodeType 
Data string 
Attr [J]Attribute 


FirstChild, NextSibling *Node 
} 
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type NodeType int32 


const ( a 
ErrorNode NodeType = iota 
TextNode 
DocumentNode 
ElementNode 
CommentNode 
DoctypeNode 
) 


type Attribute struct { 
Key, Val string 
} 


func Parse(r io.Reader) (*Node, error) 


. 主 函 数 从 标准 输入 中 读 人 HTML， 使 用 递归 的 visit 函数 获取 HTML 文本 的 超 链接 ， 
并 且 把 所 有 的 超 链接 输出 。 


gopl.io/ch5/findlinks1 
// Findlinks1 输出 从 标准 输入 中 读 入 的 HTML 文档 中 的 所 有 链接 


package main 


import ( 
"fmt" 


" a 


Os 


"golang.org/x/net/html" 
) 


func main() { 
doc, err := html.Parse(os.Stdin) 
if err != nil { 
fmt.Fprintf(os.Stderr, "findlinks1: %v\n", err) 


os.Exit(1) 

} 

for _, link := range visit(nil, doc) { 
fmt.Println(link) 

} 


} 


visit 函数 遍历 HTML 树 上 的 所 有 节点 ， 从 HTML 锚 元 素 <a href='…'> 中 得 到 href 属 
性 的 内 容 ， 将 获取 到 的 链接 内 容 添 加 到 字符 串 slice， 最 后 返回 这 个 slice: 


// visit 函数 会 将 n 节点 中 的 每 个 链接 添加 到 结果 中 
func visit(links []string, n *html.Node) []string { 
if n.Type == html.ElementNode && n.Data == "a" { 
for _, a := range n.Attr { 
if a,Key == "href" { 
links = append(links, a.Val) 
} 
bs 
} 
for c := n.FirstChild; ¢ l= nil; c = c.NextSibling { 
links = visit(links, c) 


return links 


} 


要 对 树 中 的 任意 节点 n 进行 递归 ，visit 递归 地 调用 自己 去 访问 节点 n 的 所 有 子 节 点 ， 
并 且 将 访问 过 的 节点 保存 在 Firstchild 链表 中 。 
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我 们 在 Go 的 主页 运行 findlinks， 使 用 管道 将 本 书 1.5 节 完 成 的 fetch 程序 的 输出 定向 
到 findlinks。 稍 稍 修改 输出 ， 使 之 更 加 简洁 。 


$ go build gopl.io/chi/fetch 

$ go build gopl.io/ch5/findlinks1 

$ ./fetch https://golang.org | ./findlinks1 
# 

/doc/ 

/pkg/ 

/help/ 

/blog/ 

http://play.golang.org/ 

//tour.golang.org/ 

https://golang.org/d1/ 

//blog.golang.org/ 

/LICENSE 

/doc/tos.html 
http://www.google.com/intl/en/policies/privacy/ 


可 以 注意 到 会 获取 到 各 种 不 同形 式 的 超 链接 。 之 后 我 们 将 看 到 如 何 解析 这 些 地 址 ， 并 将 
链接 都 转换 为 基于 https://golang.org 的 URL 绝对 路 径 。 

下 一 个 程序 使 用 递归 遍历 所 有 HTML 文本 中 的 节点 树 ， 并 输出 树 的 结构 。: 当 递 归 遇 到 
每 个 元 素 时 ， 它 都 会 将 元 素 标签 压 人 栈 ， 然 后 输出 栈 。 


gopl1.io/ch5/outline 
func main() { 
doc, err := html.Parse(os.Stdin) 
if err != nil { 
fmt.Fprintf(os.Stderr, "outline: %v\n", err) 
0s.Exit(1) 


outline(nil, doc) 
} 


func outline(stack []string, n *html.Node) { 
if n.Type == html.ElementNode { 
stack = append(stack, n.Data) // 把 标签 压 入 栈 
fmt.Println(stack) 
} 
for c := n.FirstChild; c != nil; c = c.NextSibling { 
outline(stack, c) 
} 
} 


注意 一 个 细节 : 尽管 outline 会 将 元 素 压 栈 但 并 不 会 出 栈 。 当 outline 递归 调用 自己 时 ， 
被 调用 的 函数 会 接收 到 栈 的 副本 。 尽 管 被 调用 者 可 能 会 对 slice 进行 元 素 的 添加 、 修改 甚至 
创建 新 数组 的 操作 ， 但 它 并 不 会 修改 调用 者 原来 传递 的 元 素 ， 所 以 当 被 调 函 数 返 回 时 ， 调 用 
者 的 栈 依旧 保持 原样 。 

以 下 是 https://golang.org 页 面 的 outline. 

$ go build gopl.io/ch5/outline 

$ ./fetch https://golang.org | ./outline 

[html] 

[html head] 

[html head meta] 


[html head title] 
[html head link] 
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[html body] 

[html body div] 

[html body div] 

[html body div div] 

[html body div div form] 

[html body div div form div] 
[html body div div form div al 


通过 outline 可 以 发 现 ， 大 多 数 的 HTML 文档 都 只 会 经 过 几 层 递归 处 理 ， 但 即使 是 一 些 
需要 复杂 递归 处 理 的 文档 也 能 够 轻松 应 对 。 

许多 编程 语言 使 用 固定 长 度 的 函数 调用 栈 ; 大 小 在 64KB 到 2MB 之 间 。 递 归 的 深度 会 
受 限 于 固定 长 度 的 栈 大 小 ， 所 以 当 进 行 深度 递归 调用 时 必须 谨防 栈 溢出 。 固 定 长 度 的 栈 甚至 
会 造成 一 定 的 安全 隐患 。 相 比 固定 长 的 栈 ，Go 语言 的 实现 使 用 了 可 变 长 度 的 栈 ， 栈 的 大 小 
会 随 着 使 用 而 增长 ， 可 达到 1GB 左右 的 上 限 。 这 使 得 我 们 可 以 安全 地 使 用 递归 而 不 用 担心 
溢出 问题 。 

练习 5.1: 改变 findlinks 程序 ， 使 用 递归 调用 visit ( 而 不 是 循环 ) 遍历 n.FirstChild 
链表 。 

练习 5.2: 写 一 个 函数 ， 用 于 统计 HTML 文档 树 内 所 有 的 元 素 个 数 ， 如 p、div、span 等 。 

练习 5.3: 写 一 个 函数 ， 用 于 输出 HTML 文档 树 中 所 有 文本 节点 的 内 容 。 但 不 包括 
<script> 或 “styley 元 素 ， 因 为 这 些 内 容 在 Web 浏览 器 中 是 不 可 见 的 。 

练习 5.4: 扩展 visit 函数 ， 使 之 能 够 获得 到 其 他 种 类 的 链接 地 址 ， 比 如 图 片 、 脚 本 或 
样式 表 的 链接 。 


5.3 多 返回 值 
一 个 函数 能 够 返回 不 止 一 个 结果 。 我 们 之 前 已 经 见 过 标准 包 内 的 许多 函数 返回 两 个 值 ， 
一 个 期 望 得 到 的 计算 结果 与 一 个 错误 值 ， 或 者 一 个 表示 函数 调用 是 否 正 确 的 布尔 值 。 下 面 来 
看 看 怎样 写 一 个 这 样 的 函数 。 
下 面 程序 中 的 findLinks 函数 有 一 个 小 的 变化 ， 它 将 自己 发 送 HTTP 请 求 ， 因 此 不 再 需 
要 运行 fetch 函数 。 因 为 HTTP 请 求 和 解析 操作 可 能 会 失败 ， 所 以 findLinks 声明 了 两 个 结 
果 : 一 个 是 发 现 的 链接 列表 ， 另 一 个 是 错误 。 另 外 ，HTML 的 解析 一 般 能 够 修正 错误 的 输入 
以 及 构造 一 个 存在 错误 节点 的 文档 ， 所 以 Parse 很 少 失 败 ; 通常 情况 下 ， 出 错 都 是 由 基本 的 
IO 错误 引起 的 。 
gopl.io/ch5/findlinks2 
func main() { 
for _, url := range os.Args[1:] { 
links, err := findLinks(ur1) 
if err l= nil { 


fmt.Fprintf(os.Stderr, "findlinks2: %v\n", err) 
continue 


for _, link := range links { 
fmt.Println(link) 
} 
} 
} 
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// findLinks 发 起 一 个 HTTP 的 GET 请求， 解析 返回 的 HTML 页 面 ， 并 返回 所 有 链接 
func findLinks(url string) ([]string，error) { 
resp, err := http.Get(url) 
if err l= nil { 
return nil, err 


if resp.StatusCode != http.StatusOK { 
resp.Body.Close() 
return nil, fmt.Errorf("getting %s: %s", url, resp.Status) 
} 
doc, err := html.Parse(resp.Body) 
resp.Body.Close() 
if err != nil { 
. return nil, fmt.Errorf("parsing %s as HTML: %v", url, err) 


} 


return visit(nil, doc), nil 


} 

findLinks 函数 有 4 个 返回 语句 ， 每 一 个 语句 返回 一 对 值 。 前 3 个 返回 语句 将 函数 从 
http 和 html 包 中 获得 的 错误 信息 传递 给 调用 者 。 第 一 个 返回 语句 中 ,错误 直接 返回 ; 第 二 
个 返回 语句 和 第 三 个 返回 语句 则 使 用 fmt.Errorf (参考 7.8 节 ) 格式 化 处 理 过 的 附加 上 下 文 
信息 。 如 果 findLinks 调用 成 功 ， 最 后 一 个 返回 语句 将 返回 链接 的 slice， 且 error 为 空 。 

我 们 必须 保证 resp.Body 正确 关闭 使 得 网 络 资源 正常 释放 。 即 使 在 发 生 错 误 的 情况 下 也 
必须 释放 资源 。Go 语言 的 垃圾 回收 机 制 将 回收 未 使 用 的 内 存 ， 但 不 能 指望 它 会 释放 未 使 用 
的 操作 系统 资源 ， 比 如 打开 的 文件 以 及 网 络 连接 。 必 须 显 式 地 关闭 它们 。 

调用 一 个 涉及 多 值 计算 的 函数 会 返回 一 组 值 。 如 果 调 用 者 要 使 用 这 些 返 回 值 ， 则 必须 显 
式 地 将 返回 值 赋 给 变量 。 

links, err := findLinks(url) 

忽略 其 中 一 个 返回 值 可 以 将 它 赋 给 一 个 空 标识 符 。 

links，_ := findLinks(url) // 忽略 的 错误 


返回 一 个 多 值 结 果 可 以 是 调用 另 一 个 多 值 返 回 的 函数 ， 就 像 下 面 的 函数 ， 这 个 函数 的 行 
为 和 findLinks 类 似 ， 只 是 多 了 一 个 记录 参数 的 动作 。 


func findLinksLog(url string) ([]string, error) { 
log.Printf("findLinks %s", url) 
return findLinks(url) 

} 


一 个 多 值 调 用 可 以 作为 单独 的 实 参 传递 给 拥有 多 个 形 参 的 函数 中 。 尽 管 很 少 在 生产 环境 
使 用 ， 但 是 这 个 特性 有 的 时 候 可 以 方便 调试 ， 它 使 得 我 们 仅仅 使 用 一 条 语句 就 可 以 输出 所 有 
的 结果 。 下 面 两 个 输出 语句 的 效果 是 一 致 的 。 

1og.Println(findLinks(url)) 


links, err := findLinks(ur1l) 
log.Println(links, err) 


良好 的 名 称 可 以 使 得 返回 值 更 加 有 意义 。 尤 其 在 一 个 函数 返回 多 个 结果 且 类 型 相同 时 ， 
名 字 的 选择 更 加 重要 ， 比 如 : 


func Size(rect image.Rectangle) (width，height int) 
func Split(path string) (dir，file string) 
func HourMinSec(t time.Time) (hour, minute, second int) 
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但 不 必 始 终 为 每 个 返回 值 单独 命名 。 比 如 ， 习 惯 上 ， 最 后 的 一 个 布尔 返回 值 表示 成 功 与 
否 ， 一 个 error 结果 通常 都 不 需要 特别 说 明 。 
一 个 函数 如 果 有 命名 的 返回 值 ， 可 以 省 略 return 语句 的 操作 数 ， 这 称 为 裸 返 回 。 


// CountWordsAndImages 发 送 一 个 HTTP GET 请 求 ， 并 且 获 取 文档 的 
// 字数 与 图 片 数 量 
func CountWordsAndImages(url string) (words, images int, err error) { 
resp, err := http.Get(url) 
if err != nil { 
return 
} 
doc, err := html.Parse(resp.Body) 
resp.Body.Close() 


if err != nil { 
err = fmt.Errorf("parsing HTML: %s", err) 
return 


words, images = countWordsAndImages(doc) 


return 
} 
func countWordsAndImages(n *html.Node) (words, images int) { /* ... */ } 
裸 返回 是 将 每 个 命名 返回 结果 按照 顺序 返回 的 快捷 方法 ， 所 以 在 上 面 的 函数 中 ， 每 个 
return 语句 都 等 同 于 : 


return words, images, err 


像 在 这 个 函数 中 存在 许多 返回 语句 且 有 多 个 返回 结果 ， 裸 返回 可 以 消除 重复 代码 ,但 是 
并 不 能 使 代码 更 加 易于 理解 。 比 如 ， 对 于 这 种 方式 ， 在 第 一 眼看 来 ， 不 能 直观 地 看 出 前 两 
个 返回 等 同 于 return e，8，err (因为 结果 变量 words 和 images 初始 化 值 为 0 ) 而 且 最 后 一 个 
return 等 同 于 return words，images，nil。 鉴 于 这 个 原因 ， 应 保守 使 用 裸 返 回 。 

练习 5.5: 实现 函数 countwordsAndImages (参照 练习 4.9 中 的 单词 分 隔 )。 

练习 5.6 : 修改 gop1l.io/ch3/surface (参考 3.2 节 ) 中 的 函数 corner， 以 使 用 命名 的 结果 
以 及 裸 返回 语句 。 


5.4 ”错误 


有 一 些 函 数 总 是 成 功 返 回 的 。 比 如 ，strings.Contains 和 strconv.FormatBool 对 所 有 可 
能 的 参数 变量 都 有 定义 好 的 返回 结果 ， 不 会 调用 失败 一 一 尽管 还 有 灾难 性 的 和 不 可 预知 的 场 
景 ， 像 内 存 耗 尽 ， 这 类 错误 的 表现 和 起 因 相差 甚 远 而 且 恢复 的 希望 也 很 渺茫 。 

其 他 的 函数 只 要 符合 其 前 置 条 件 就 能 够 成 功 返 回 。 比 如 time.Date 函数 始终 会 利用 年 、 
月 等 构成 time.Time， 但 是 如 果 最 后 一 个 参数 (表示 时 区 ) 为 nil 则 会 导致 宕 机 。 这 个 宕 机 标 
志 着 这 是 一 个 明显 的 bug， 应 该 避免 这 样 调用 代码 。 

对 于 许多 其 他 函数 ， 即 使 在 高 质量 的 代码 中 ， 也 不 能 保证 一 定 能 够 成 功 返 回 ， 因 为 有 些 
因素 并 不 受 程序 设计 者 的 掌控 。 比 如 任何 操作 IO 的 函数 都 一 定 会 面 对 可 能 的 错误 ， 只 有 没 
有 经 验 的 程序 员 会 认为 一 个 简单 的 读 或 写 不 会 失败 。 事 实 上 ， 这 些 地 方 是 我 们 最 需要 关注 
的 ， 很 多 可 靠 的 操作 都 可 能 会 毫 无 征兆 地 发 生 错误 。 

因此 错误 处 理 是 包 的 API 设计 或 者 应 用 程序 用 户 接口 的 重要 部 分 ， 发 生 错 误 只 是 许多 预 
料 行为 中 的 一 种 而 已 。 这 就 是 Go 语言 处 理 错误 的 方法 。 
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如 果 当 函数 调用 发 生 错 误 时 返回 一 个 附加 的 结果 作为 错误 值 ， 习 惯 上 将 错误 值 作为 最 后 
一 个 结果 返回 。 如 果 错 误 只 有 一 种 情况 ， 结 果 通 常设 置 为 布尔 类 型 ， 就 像 下 面 这 个 查询 缓存 
值 的 例子 里 面 ， 往 往 都 返回 成 功 ， 只 有 不 存在 对 应 的 键 值 的 时 候 返 回 错误 : 


value, ok := cache.Lookup(key) 
df bok 

// ...cache[key] 不 存在 ... 
} 


更 多 时 候 ， 尤 其 对 于 IO 操作 ， 错 误 的 原因 可 能 多 种 多 样 ， 而 调用 者 则 需要 一 些 详细 的 
信息 。 在 这 种 情况 下 ， 错 误 的 结果 类 型 往往 是 error。 

error 是 内 置 的 接口 类 型 。 第 7 章 将 通过 介绍 错误 处 理 揭示 更 多 关于 error 类 型 的 深层 
含义 。 目 前 我 们 已 经 了 解 到 ， 一 个 错误 可 能 是 空 值 或 者 非 空 值 ， 空 值 意味 着 成 功 而 非 空 值 意 
味 着 失败 ， 且 非 空 的 错误 类 型 有 一 个 错误 消息 字符 串 ， 可 以 通过 调用 它 的 Error 方法 或 者 通 
过 调用 fmt.Println(err) 或 fmt.Printf("%v",err) 直接 输出 错误 消息 : 

一 般 当 一 个 函数 返回 一 个 非 空 错误 时 ， 它 其 他 的 结果 都 是 未 定义 的 而 且 应 该 忽略 。 然 
而 ， 有 一 些 函 数 在 调用 出 错 的 情况 下 会 返回 部 分 有 用 的 结果 。 比 如 ， 如 果 在 读 取 一 个 文件 的 
时 候 发 生 错误 ， 调 用 Read 函数 后 返回 能 够 成 功 读 取 的 字 节 数 与 相对 应 的 错误 值 。 正 确 的 行 
为 通常 是 在 调用 者 处 理 错误 前 先 处 理 这 些 不 完整 的 返回 结果 。 因 此 在 文档 中 清晰 地 说 明 返 回 
值 的 意义 是 很 重要 的 。 

与 许多 其 他 语言 不 同 ，Go 语言 通过 使 用 普通 的 值 而 非 异常 来 报告 错误 。 尽 管 Go 语言 
有 异常 机 制 ， 这 将 在 5.9 节 进 行 介 绍 ， 但 是 Go 语言 的 异常 只 是 针对 程序 bug 导致 的 预料 外 
的 错误 ， 而 不 能 作为 常规 的 错误 处 理 方法 出 现在 程序 中 。 

这 样 做 的 原因 是 异常 会 陷入 带 有 错误 消息 的 控制 流 去 处 理 它 ， 通 常会 导致 预期 外 的 结 
果 : 错误 会 以 难以 理解 的 栈 跟踪 信息 报告 给 最 终 用 户 ， 这 些 信息 大 都 是 关于 程序 结构 方面 的 
而 不 是 简单 明了 的 错误 消息 。 

相 比 之 下 ，Go 程序 使 用 通常 的 控制 流 机 制 (比如 if 和 return 语句 ) 应 对 错误 。 这 种 方 
式 在 错误 处 理 逻 辑 方面 要 求 更 加 小 心 谨慎 ,但 这 恰恰 是 设计 的 要 点 。 


5.4.1 错误 处 理 策略 


当 一 个 阴 数 调用 返回 一 个 错误 时 ， 调 用 者 应 当 负 责 检 查 错误 并 采取 合适 的 处 理应 对 。 根 
据 情 形 ， 将 有 许多 可 能 的 处 理 场景 。 接 下 来 我 们 看 5 个 例子 。 

首先 也 最 常见 的 情形 是 将 错误 传递 下 去 ， 使 得 在 子 例 程 中 发 生 的 错误 变 为 主 调 例 程 的 错 
误 。5.3 节 讨 论 过 findLinks 函数 的 示例 。 如 果 调 用 http.Get 失败 ，findLinks 不 做 任何 操作 
立即 向 调用 者 返回 这 个 HTTP 错误 。 


resp, err := http.Get(url) 
if err != nil { 
return nil, err 


} 


对 比 之 下 ， 如 果 调 用 html.Parse 失败 ，findLinks 将 不 会 直接 返回 HTML 解析 的 错 
误 ， 因 为 它 缺 失 两 个 关键 信息 : 解析 器 的 出 错 信 息 与 被 解析 文档 的 URL。 在 这 种 情况 下 ， 
findLinks 构建 一 个 新 的 错误 消息 ， 其 中 包含 我 们 需要 的 所 有 相关 信息 和 解析 的 错误 信息 : 


doc, err := html.Parse(resp.Body) 
resp.Body.Close() 
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if err != nil { 
return nil, fmt.Errorf("parsing %s as HTML: %v", url, err) 


} 


fmt.Errorf 使 用 fmt.sprintf 函数 格式 化 一 条 错误 消息 并 且 返 回 一 个 新 的 错误 值 。 我 们 
为 原始 的 错误 消息 不 断 地 添加 额外 的 上 下 文 信息 来 建立 一 个 可 读 的 错误 描述 。 当 错误 最 终 被 
程序 的 main 函数 处 理 时 ， 它 应 当 能 够 提供 一 个 从 最 根本 问题 到 总 体 故障 的 清晰 因果 链 ， 这 
让 我 想到 NASA 的 事故 调查 有 这 样 一 个 例子 : 


genesis: crashed: no parachute: G-switch failed: bad relay orientation 


因为 错误 消息 频繁 地 串联 起 来 ， 所 以 消息 字符 串 首 字 母 不 应 该 大 写 而 且 应 该 避免 换行 。 
错误 结果 可 能 会 很 长 ， 但 能 够 使 用 grep 这 样 的 工具 找到 我 们 需要 的 信息 。 

设计 一 个 错误 消息 的 时 候 应 当 慎重 ， 确 保 每 一 条 消息 的 描述 都 是 有 意义 的 ， 包 含 充足 的 
相关 信息 ， 并 且 保 持 一 致 性 ， 不 论 被 同一 个 函数 还 是 同一 个 包 下 面 的 一 组 函数 返回 时 ， 这 样 
的 错误 都 可 以 保持 统一 的 形式 和 错误 处 理 方式 。 

比如 ，os 包 保 证 每 一 个 文件 操作 (比如 os.open 或 针对 打开 的 文件 的 Read、write 或 
close 方法 ) 返回 的 错误 不 仅 包括 错误 的 信息 (没有 权限 、 路 径 不 存在 等 ) 还 包含 文件 的 名 
字 ， 因 此 调用 者 在 构造 错误 消息 的 时 候 不 需要 再 包含 这 些 信息 。 

一 般 地 ，f(x) 调用 只 负责 报告 函数 的 行为 f 和 参数 值 x， 因 为 它们 和 错误 的 上 下 文 相关 。 
调用 者 负责 添加 进一步 的 信息 ， 但 是 f(x) 本 身 并 不 会 ， 就 像 上 面 函 数 中 URL 和 html.Parse 
的 关系 。 

我 们 接 下 来 看 一 下 第 二 种 错误 处 理 策略 。 对 于 不 固定 或 者 不 可 预测 的 错误 ， 在 短暂 的 间 
隔 后 对 操作 进行 重 试 是 合乎 情理 的 ， 超 出 一 定 的 重 试 次 数 和 限定 的 时 间 后 再 报错 退出 。 


gopl.io/ch5/wait 
// WaitForServer 尝试 连接 URL 对 应 的 服务 器 
// 在 一 分 钟 内 使 用 指数 退 避 策略 进行 重 试 
// 所 有 的 尝试 失败 后 返回 错误 
func WaitForServer(url string) error { 
const timeout = 1 * time.Minute 
deadline := time.Now().Add(timeout) 





for tries := 6; time.Now().Before(deadline); tries++ { 
_,， err := http.Head(url) 
if err == nil 


{ 
return nil // 成 功 


log.Printf("server not responding (%s); retrying...", err) 
time.Sleep(time.Second << uint(tries)) // 指数 退 避 策略 
} 


return fmt.Errorf("server %s failed to respond after %s", url, timeout) 


} 

第 三 ， 如 果 依 旧 不 能 顺利 进行 下 去 ， 调 用 者 能 够 输出 错误 然后 优雅 地 停止 程序 ， 但 一 般 
这 样 的 处 理应 该 留 给 主 程序 部 分 。 通 常 库 函 数 应 当 将 错误 传递 给 调用 者 ， 除 非 这 个 错误 表示 
一 个 内 部 一 致 性 错误 ， 这 意味 着 库 内 部 存在 bug。 


// (In function main.) 


if err := WaitForServer(url); err != nil { 
fmt.Fprintf(os.Stderr, "Site is down: %v\n", err) 
os.Exit(1) 


} 
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一 个 更 加 方便 的 方法 是 通过 调用 log.Fatalf 实现 相同 的 效果 。 就 和 所 有 的 日 志 函 数 一 
样 ， 它 默认 会 将 时 间 和 日 期 作为 前 缀 添加 到 错误 消息 前 。 


if err := WaitForServer(url); err != nil { 
log.Fatalf("Site is down: %v\n", err) 


} 
默认 的 格式 有 助 于 长 期 运行 的 服务 器 ， 而 对 于 交互 式 的 命令 行 工具 则 意义 不 大 ; 
2866/81/82 15:64:65 Site is down: no such domain: bad.gopl.io 


一 种 更 吸引 人 的 输出 方式 是 自己 定义 命令 的 名 称 作为 log 包 的 前 缀 ， 并 且 将 日 期 和 时 间 
略 去 。 


log.Setprefix("wait: ") 
log.SetFlags(08) 


第 四 ， 在 一 些 错 误 情况 下 ， 只 记录 下 错误 信息 然后 程序 继续 运行 。 同 样 地 ， 可 以 选择 使 
用 log 包 来 增加 日 志 的 常用 前 级 : 


if err := Ping(); err != nil { 
log.Printf("ping failed: %v; networking disabled", err) 
} 


并 且 直 接 输出 到 标准 错误 流 : 


if err := Ping(); err != nil { 
fmt.Fprintf(os.Stderr，"ping failed: %v; networking disabled\n", err) 


(所 有 log 函数 都 会 为 缺少 换行 符 的 日 志 补充 一 个 换行 符 。) 
第 五 ， 在 某 些 罕见 的 情况 下 我 们 可 以 直接 安全 地 忽略 掉 整 个 日 志 : 


dir, err := ioutil.TempDir("", "scratch") 
if err != nil { 
return fmt.Errorf("failed to create temp dir: %v", err) 


} 
// ... 使 用 临时 目录 ... 
0S.RemoveAll(dir) // 忽 略 错误 ，$TMPDIR 会 被 周期 性 删除 


调用 os.RemoveAll 可 能 会 失败 ,但 程序 忽略 了 这 个 错误 ， 原因 是 操作 系统 会 周期 性 地 清 
理 临 时 目录 。 在 这 个 例子 中 ,我 们 有 意 地 抛弃 了 错误 ， 但 程序 的 逻辑 看 上 去 就 和 我 们 忘记 去 
处 理 了 一 样 。 要 习惯 考虑 到 每 一 个 函数 调用 可 能 发 生 的 出 错 情况 ， 当 你 有 意 地 忽略 一 个 错误 
的 时 候 ， 清 楚 地 注释 一 下 你 的 意图 。 

Go 语言 的 错误 处 理 有 特定 的 规律 。 进 行 错误 检查 之 后 ， 检 测 到 失败 的 情况 往往 都 在 成 
功 之 前 。 如 果 检 测 到 的 失败 导致 函数 返回 ， 成 功 的 逻辑 一 般 不 会 放 在 else 块 中 而 是 在 外 层 
的 作用 域 中 。 函 数 会 有 一 种 通常 的 形式 ， 就 是 在 开头 有 一 连 串 的 检查 用 来 返回 错误 ， 之 后 跟 
着 实际 的 函数 体 一 直到 最 后 。 


5.4.2 文件 结束 标识 


通常 ， 最 终 用 户 会 对 函数 返回 的 多 种 错误 感 兴趣 而 不 是 中 间 涉 及 的 程序 逻辑 。 偶 尔 ， 一 
个 程序 必须 针对 不 同 各 种 类 的 错误 采取 不 同 的 措施 。 考 虑 如 果 要 从 一 个 文件 中 读 取 n 个 字 节 
的 数据 。 如 果 n 是 文件 本 身 的 长 度 ， 任 何 错误 都 代表 操作 失败 。 另 一 方面 ， 如 果 调 用 者 反复 
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地 尝试 读 取 固 定 大 小 的 块 直到 文件 耗 尽 ， 调 用 者 必须 把 读 取 到 文件 尾 的 情况 区 别 于 遇 到 其 他 
错误 的 操作 。 为 此 ，io 包 保 证 任何 由 文件 结束 引起 的 读 取 错误 ， 始 终 都 将 会 得 到 一 个 与 众 不 
同 的 错误 一 一 io.E0F， 它 的 定义 如 下 : 


package io 





import "errors" 

// 当 没有 更 多 输入 时 ， 将 会 返回 EOF 

var EOF = errors.New("EOF") 

调用 者 可 以 使 用 一 个 简单 的 比较 操作 来 检测 这 种 情况 ， 在 下 面 的 循环 中 ， 不 断 从 标准 输 
入 中 读 取 字 符 。( 4.3 节 的 charcount 程序 提供 了 一 个 更 完整 的 示例 。) 


in := bufio.NewReader(os.Stdin) 
for { 
r, _, err := in.ReadRune() 
if err == io.EOF { 
break // 结束 读 取 


if -erp ls nil { 
return fmt.Errorf("read failed: %v", err) 


} 
/ss 合 用 -Vas 
} 


除了 反映 这 个 实际 情况 外 ， 因 为 文件 结束 的 条 件 没有 其 他 信息 ， 所 以 io.EoF 有 一 条 固 
定 的 错误 消息 "EoF"。 对 于 其 他 错误 ， 我 们 可 能 需要 同时 得 到 错误 相关 的 本 质 原因 和 数量 信 
息 ， 因 此 一 个 固定 的 错误 值 并 不 能 满足 我 们 的 需求 。7.11 节 将 会 呈现 一 个 更 加 系统 的 方式 以 
区 分 某 个 错误 值 。 


5.5 函数 变量 


函数 在 Go 语言 中 是 头等 重要 的 值 : 就 像 其 他 值 ， 函 数 变量 也 有 类 型 ， 而 且 它 们 可 以 赋 
给 变量 或 者 传递 或 者 从 其 他 函数 中 返回 。 函 数 变量 可 以 像 其 他 函数 一 样 调用 。 比 如 : 
func square(n int) int { returnn*n} 


func negative(n int) int { return -n } 
func product(m, n int) int { returnm* n} 


f := Square 

fmt.Println(f(3)) // "9" 

f = negative 

fmt.Println(f(3)) // "-3" 
fmt.Printf("%T\n", f) // "func(int) int" 


f = product // 编 译 错误 : 不 能 把 类 型 func(int，int) int 赋 给 func(int) int 


函数 类 型 的 零 值 是 nil ( 空 值 )， 调 用 一 个 空 的 函数 变量 将 导致 宕 机 。 
var f func(int) int 

f(3) // 宕 机 : 调用 空 函 数 

函数 变量 可 以 和 空 值 相 比 较 : 

var f func(int) int 

if f l= nil { 


f(3) 
} 
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但 它们 本 身 不 可 比较 ， 所 以 不 可 以 互相 进行 比较 或 者 作为 键 值 出 现在 map 中 。 

卫 数 变量 使 得 函数 不 仅 将 数据 进行 参数 化 ， 还 将 函数 的 行为 当 作 参 数 进 行 传递 。 标 准 库 
中 缆 含 者 大 量 的 例子 。 比 如 ，strings.Map 对 字符 串 中 的 每 一 个 字符 使 用 一 个 函数 ， 将 结果 
连接 起 来 变 成 另 一 个 字符 串 。 

func add1(r rune) rune { return r +1} 


fmt.Println(strings.Map(add1，"HAL-98866")) // "IBM.:111" 
fmt.Println(strings.Map(add1, "VMS")) // "WNT" 


fmt.Println(strings.Map(add1, "Admix")) // "Benjy" 


5.2 节 中 的 findLinks 函数 使 用 了 一 个 辅助 函数 visit， 它 访问 HTML 文档 中 所 有 的 节点 
而 后 对 每 一 个 节点 进行 操作 。 使 用 函数 变量 ， 可 以 使 得 我 们 将 每 个 节点 的 操作 逻辑 从 遍历 树 
形 结构 的 逻辑 中 分 开 。 下 面 通过 不 同 的 操作 重用 该 遍历 逻辑 。 

gopl.io/ch5/outline2 

// forEachNode 调用 pre(x) 和 post(x) 斋 历 以 n 为 根 的 树 中 的 每 个 节点 x 

// 两 个 函数 是 可 选 的 

// pre 在 子 节点 被 访问 前 (前 序 ) 调用 

// post 在 访问 后 (后 序 ) 调用 

func forEachNode(n *html.Node, pre, post func(n *html.Node)) { 

if pre != nil { 
pre(n) 





for c := nN.FirstChild; c != nil; c = c.NextSibling { 
forEachNode(c, pre, post) 
} 


if post != nil { 
post(n) 


} 


这 里 forEachNode 函数 接受 两 个 函数 作为 参数 ， 一 个 在 本 节点 所 有 子 节点 都 被 访问 
前 调用 ， 另 一 个 则 在 之 后 。 这 样 的 代码 组 织 给 调用 者 提供 了 很 多 的 灵活 性 。 比如 ， 函 数 
startElement 和 endElement 输出 HTML 元 素 的 起 始 和 结束 标签 ， 如 <b>…</b>: 


var depth int 
func startElement(n *html.Node) { 
if n.Type == html.ElementNode { 
fmt.Printf("%*s<%s>\n", depth*2, "", n.Data) 
depth++ 
} 


func endElement(n *html.Node) { 
if n.Type == html.ElementNode { 
depth-- 
fmt.Printf("%*s</%s>\n", depth*2, "", n.Data) 
} 
} 


这 两 个 函数 巧妙 地 利用 fmt.Printf 来 缩 进 输出 。%*s 中 的 * 号 输出 带 有 可 变数 量 空格 的 
字符 串 。 输 出 的 宽度 和 字符 串 则 由 参数 depth*2 和 "" 提供 。 
如 果 对 HTML 文档 调用 forEachNode 函数 ， 比 如 : 


forEachNode(doc, startElement, endElement) 


江 
eh 
地 
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可 以 使 之 前 的 outline 函数 得 到 一 个 更 加 直观 的 输出 。 


$ go build gopl.io/ch5/outline2 
$ ./outline2 http://gopl.io 
<html> 
<head> 
<meta> 
</meta> 
<title> 
</title> 
<style> 
</style> 
</head> 
<body> 
<table> 
<tbody> 
<tr> 
< 七 d> 
<a> 
<img> 
</img> 


练习 5.7 : 开发 startElement 和 endElelment 函数 并 应 用 到 一 个 通用 的 HTML 输出 代码 
中 。 输 出 注释 节点 、 文 本 节点 和 所 有 元 素 属 性 (<a href='…'>)。 当 一 个 元 素 没 有 子 节点 时 ， 
使 用 简短 的 形式 ， 比 如 <img/> 而 不 是 ximg></img>。 写 一 个 测试 程序 保证 输出 可 以 正确 解析 
(参考 第 11 章 )。 

练习 5.8 : 修改 forEachNode 使 得 pre 和 post 函数 返回 一 个 布尔 型 的 结果 来 确定 忆 历 是 
否 继续 下 去 。 使 用 它 写 一 个 函数 ElementByID， 该 函数 使 用 下 面 的 函数 签名 并 且 找 到 第 一 个 
符合 id 属性 的 HTML 元 素 。 函 数 在 找到 符合 条 件 的 元 素 时 应 该 尽快 停止 过 历 。 


func ElementByID(doc *html.Node, id string) *html.Node 


练习 5.9 : 写 一 个 函数 expand(s string，f func(string)string)string， 该 函数 替换 参数 
s 中 每 一 个 子 字符 串 "gfoo" 为 f("foo") 的 返回 值 。 


5.6 匿名 函数 


命名 函数 只 能 在 包 级 别 的 作用 域 进行 声明 ， 但 我 们 能 够 使 用 函数 字面 量 在 任何 表达 式 内 
指定 函数 变量 。 函 数字 面 量 就 像 函 数 声 明 ， 但 在 func 关键 字 后 面 没 有 函数 的 名 称 。 它 是 一 
个 表达 式 ， 它 的 值 称 作 匿 名 函数 。 

函数 字面 量 在 我 们 需要 使 用 的 时 候 才 定义 。 就 像 下 面 这 个 例子 ,之 前 的 函数 调用 
strings.Map 可 以 写成 : 


strings.Map(func(r rune) rune { return r + 1 }, "HAL-9666") 
更 重要 的 是 ， 以 这 种 方式 定义 的 函数 能 够 获取 到 整个 词法 环境 ， 因 此 里 层 的 函数 可 以 使 
用 外 层 函 数 中 的 变量 ， 如 下 面 这 个 示例 所 示 : 


gopl.io/ch5/squares 
// squares 函数 返回 一 个 函数 ， 后 者 包含 下 一 次 要 用 到 的 平方 数 


// the next square number each time it is called. 
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func squares() func() int { 


var x int 
return func() int { 
X++ 
return x * x 
} 
} 
func main() { 
f := squares() 


fmt.Println(f()) // "1" 
fmt.Println(f()) // "4" 
fmt.Println(f()) // "9" 
fmt.Println(f()) // "16" 

} 

函数 squares 返回 了 另 一 个 函数 ， 类 型 是 func() int。 调 用 squares 创建 了 一 个 局 部 变量 
x 而 且 返回 了 一 个 匿名 函数 ， 每 次 调用 squares 都 会 递增 x 的 值 然后 返回 x 的 平方 。 第 二 次 
调用 squares 函数 将 创建 第 二 个 变量 x， 然 后 返回 一 个 递增 x 值 的 新 匿名 函数 。 

这 个 求 平方 的 示例 演示 了 函数 变量 不 仅 是 一 段 代 码 还 可 以 拥有 状态 。 里 层 的 匿名 阻 数 能 
够 获取 和 更 新 外 层 squares 函数 的 局 部 变量 。 这 些 隐 藏 的 变量 引用 就 是 我 们 把 函数 归 类 为 引 
用 类 型 而 且 函 数 变量 无 法 进行 比较 的 原因 。 函 数 变量 类 似 于 使 用 闭 包 方法 实现 的 变量 ，Go 
程序 员 通 常 把 函数 变量 称 为 闭 包 。 

我 们 再 一 次 看 到 这 个 例子 里 面 变 量 的 生命 周期 不 是 由 它 的 作用 域 所 决定 的 : 变量 x 在 
main 水 数 中 返回 squares 函数 后 依旧 存在 (虽然 x 在 这 个 时 候 是 隐藏 在 函数 变量 f 中 的 )。 

在 下 面 这 个 与 学 术 课程 相关 的 匿名 函数 例 程 中 ， 考 虑 学 习 计 算 机 科学 课程 的 顺序 ， 需 要 
计算 出 学 习 每 一 门 课程 的 先决 条 件 。 先 决 课程 在 下 面 的 prereqs 表 中 已 经 给 出 ， 其 中 给 出 了 
学 习 每 一 门 课程 必须 提前 完成 的 课程 列表 关系 。 

gopl.io/chs/toposort 
// 反映 了 所 有 课程 和 先决 课程 的 关系 


var prereqs = map[string][]string{ 
"algorithms": {"data structures"}, 
"calculus": {"linear algebra"}, 





"compilers": { 
"data structures", 
"formal languages", 
"computer organization", 


}, 

"data structures": {"discrete math"}, 

"databases": {"data structures"}, 

"discrete math": {"intro to programming"}, 

"formal languages": {"discrete math"}, 

"networks": {"operating systems"}, 

"operating systems": {"data structures", "computer organization"}, 


"programming languages": {"data structures", "computer organization"}, 
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这 样 的 问题 是 我 们 所 熟知 的 拓扑 排序 。 概 念 上 ， 先 决 条 件 的 内 容 构 成 一 张 有 向 图 ， 每 一 
个 节点 代表 每 一 门 课程 ， 每 一 条 边 代 表 一 门 课程 所 依赖 另 一 门 课程 的 关系 。 图 是 无 环 的 : 没 
有 节点 可 以 通过 图 上 的 路 径 回 到 它 自己 。 我 们 可 以 使 用 深度 优先 的 搜索 算法 计算 得 到 合法 的 
学 习 路 径 ， 如 以 下 代码 所 示 : 
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func main() { 
for i, course := range topoSort(prereqs) { 
fmt.Printf("%d:\t%s\n", i+1, course) 
} 
} 


func topoSsort(m map[string][]string) []string { 
var order []string 
seen := make(map[string]bool) 
var visitAll func(items []string) 
visitAll = func(items []string) { 
for _, item := range items { 
if !seen[item] { 
seen[item] = true 
visitAll(m[item]) 
order = append(order, item) 


} 
} 
var keys []string 
for key := range m { 
keys = append(keys, key) 
} 
sort.Strings(keys) 
visitAll(keys) 
return order 


} 
当 一 个 匿名 函数 需要 进行 递归 ， 在 这 个 例子 中 ， 必 须 先 声明 一 个 变量 然后 将 匿名 函数 赋 
给 这 个 变量 。 如 果 将 两 个 步 又 合并 成 一 个 声明 ， 函 数字 面 量 将 不 能 存在 于 visitAll 变量 的 作 
用 域 中 ， 这 样 也 就 不 能 递归 地 调用 自己 了 。 
visitAll := func(items []string) { 
visitAll(m[item]) // compile error: undefined: visitAll 
Dh oa 
} 
下 面 是 拓扑 排序 的 程序 输出 。 它 是 确定 的 结果 ， 得 到 令 人 满意 的 结果 并 不 容易 。 在 这 
里 ，prereqs 的 值 都 是 slice 而 不 是 map， 所 以 它们 的 迭代 顺序 是 确定 的 并 且 我 们 在 调用 最 初 
的 visitAll 之 前 将 prereqs 的 键 值 进行 了 排序 。 | 


1 intro to programming 
2 discrete math 

3: data structures 

4: algorithms 

5 linear algebra 

6 calculus 

7 formal languages 

8: computer organization 
9 compilers 

10: databases 

iTs operating systems 

12: networks 

133 programming languages 


回 到 findLinks 例子 。 由 于 在 第 8 章 还 需要 用 到 它 ， 因 此 我 们 将 解析 链接 的 函数 links. 
Extract 移动 到 它 自 己 的 包 中 。 我 们 将 原本 的 visit 函数 替换 为 匿名 函数 ， 并 直接 放 到 存放 链 
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接 的 slice 之 后 ， 然 后 用 forEachNode 处 理 递 归 。 因 为 Extract 函数 只 需要 pre 函数 ， 所 以 把 
post 部 分 的 参数 填 nil。 


gopl.io/ch5/links 


// link 包 提供 了 解析 链接 的 函数 
package links 


import ( 
"fmt" 
"net/http" 


"golang.org/x/net/html" 
) 


// Extract 函数 向 给 定 URL 发 起 HTTP GET 请 求 
// 解析 HTML 并 返回 HTML 文 档 中 存在 的 链接 
func Extract(url string) ([]string, error) 
resp, err := http.Get(url) 
if err != nil { 
return nil, err 


~ 


if resp.StatusCode != http.StatusOK { 
resp.Body.Close() 
return nil, fmt.Errorf("getting %s: %s", url, resp.Status) 


} 


doc, err := html.Parse(resp.Body) 
resp.Body.Close() 
if err != nil { 
return nil, fmt.Errorf("parsing %s as HTML: %v", url, err) 


有 


var links []string 
visitNode := func(n *html.Node) { 


if n.Type == html.ElementNode && n.Data == "a" { 
for _, a := range n.Attr { 
if a.Key != "href" { 
continue 
} 
link, err := resp.Request.URL.Parse(a.Val) 
if err != nil { 


continue // 忽略 不 合法 的 URL 


. 
links = append(links, link.String()) 


} 


forEachNode(doc, visitNode, nil) 
return links, nil 


} 


在 这 个 版 本 里 ， 我 们 并 不 是 直接 把 href 原封 不 动 地 添加 到 存放 链接 的 slice 中 ， 而 是 将 
它 解 析 成 基于 当前 文档 的 相对 路 径 resp.Request.URL。 结 果 的 链接 是 绝对 路 径 的 形式 ， 非 常 
适用 于 调用 函数 http.Get。 

网 页 仆 虫 的 核心 是 解决 图 的 遍历 。 拓 扑 排 序 的 示例 展示 了 深度 优先 遍历 ; 对 于 网 络 疏 
虫 ， 我 们 使 用 广度 优先 遍历 。 第 8 章 将 探索 并 发 遍历 。 

下 面 的 示例 函数 展示 了 广度 优先 遍历 的 精髓 。 调 用 者 提供 一 个 初始 列表 worklist， 它 包 
含 要 访问 的 项 和 一 个 函数 变量 f 用 来 处 理 每 一 个 项 。 每 一 个 项 用 字符 串 来 识别 。 函 数 f 将 返 
回 一 个 新 的 项 列表 ， 其 中 包含 需要 新 添加 到 worklist 中 的 项 。breadthFirst 函数 将 在 所 有 节 
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点 项 都 被 访问 后 返回 。 它 需要 维护 一 个 字符 串 集 合用 来 保证 每 个 节点 只 访问 一 次 。 
gopl.io/ch5/findlinks3 


// breadthFirst 对 每 个 worklist 元 素 调用 f 
// 并 将 返回 的 内 容 添加 到 work1list 中 ， 对 每 一 个 元 素 ， 最 多 调用 一 次 f 
// f is called at most once for each item. 
func breadthFirst(f func(item string) []string, worklist []string) { 
seen := make(map[string]bool) 
for len(worklist) > 6 { 
items := worklist 
worklist = nil 
for _, item := range items { 
if !seen[item] { 
seen[item] = true 
worklist = append(worklist, f(item)...) 





就 像 第 4 童 介绍 过 的 ， 参数“ f(item)...” 将 会 把 f 返 回 的 列表 中 的 所 有 项 添加 到 


worklist 中 。 


在 爬虫 里 ， 项 节点 都 是 URL。 我 们 提供 crawl 函数 给 breadthFirst 以 输出 URL， 解 析 
链接 然后 将 它们 返回 ， 标 记 为 已 访问 。 


func crawl(url string) []string { 
fmt.Println(url) 
list, err := links.Extract(url) 
if err != nil { 
log.Print(err) 


return list 


} 
为 了 让 扑 虫 开始 工作 ， 我 们 使 用 命令 行 参数 指定 开始 的 URL。 


func main() { 
// 开始 广度 遍历 
// 从 命令 行 参数 开始 
breadthFirst(crawl, os.Args[1:]) 
} 


我 们 从 https://golang.org 开始 爬 网 页 。 这 里 是 一 些 输出 的 链接 : 


$ go build gopl.io/ch5/findlinks3 
$ ./findlinks3 https://golang.org 
https://golang.org/ 
https://golang.org/doc/ 
https://golang.org/pkg/ 
https://golang.org/project/ 
https://code.google.com/p/go-tour/ 
https://golang.org/doc/code.html 
https://www.youtube.com/watch?v=XCsL89YtqCs 
http://research. swtch.com/gotour 
https://vimeo.com/53221566 


整个 过 程 将 在 所 有 可 到 达 的 网 页 被 访问 到 或 者 内 存 耗 尽 时 结束 。 
练习 5.10 : 重 写 toposort 以 使 用 map 代替 slice 并 去 掉 开 头 的 排序 。 结 果 不 是 唯一 的 ， 
验证 这 个 结果 是 合法 的 拓扑 排序 。 
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练习 5.11 : 现在 有 “线性 代数 ”( linear algebra) 这 门 课程 ， 它 的 先决 课程 是 微 积 分 
(calculus)。 扩 展 toposort 以 函数 输出 结果 。 

练习 5.12 : 5.5 节 ( gopl.io/ch5/outline2 ) 的 startElement 和 endElement 函数 共享 一 个 
全 局 变量 depth。 把 它们 变 为 匿名 函数 以 共享 outline 函数 的 一 个 局 部 变量 。 

练习 5.13 : 修改 crawl 函数 保存 找到 的 页 面 ， 根 据 需 要 创建 目录 。 不 要 保存 不 同 域名 
下 的 页 面 。 比 如 ， 如 果 本 来 的 页 面 来 自 golang.org， 那 么 就 把 它们 保存 下 来 但 是 不 要 保存 
vimeo.com 下 的 页 面 。 

练习 5.14 : 使 用 广度 优先 遍历 搜索 一 个 不 同 的 拓扑 结构 。 比 如 ， 你 可 以 借鉴 拓扑 排序 
的 例子 (有 向 图 ) 里 的 课程 依赖 关系 ,计算 机 文件 系统 的 分 层 结 构 ( 树 形 结构 )， 或 者 从 当前 
城市 的 官方 网 站 上 下 载 公共 汽车 或 者 地 铁 线路 图 (无 向 图 )。 
警告 : 捕获 迭代 变量 

在 这 一 他， 我 们 将 看 到 Go 语言 的 词法 作用 域 规则 的 陷阱 ， 有 时 会 得 到 令 你 吃惊 的 
果 。 我 们 强烈 建议 你 先 理解 这 个 问题 再 进行 下 一 节 的 阅读 ， 因 为 即使 是 有 经 验 的 程序 员 也 
掉 人 这 些 陷 阱 。 

假设 一 个 程序 必须 创建 一 系列 的 目录 之 后 又 会 删除 它们 。 可 以 使 用 一 个 包含 函数 变量 的 
slice 进行 清理 操作 。( 这 个 示例 中 省 略 了 所 有 的 错误 处 理 逻 辑 。) 

var rmdirs []func() 

for _, d := range tempDirs() { 

dir := d // 注意 ， 这 一 行 是 必需 的 
os.MkdirAl1(dir，6755) // 也 创建 父 目录 


rmdirs = append(rmdirs, func() { 
oOs.RemoveAll(dir) 


}) 
} 
// .…. 这 里 做 一 些 处 理 ... 
for _, rmdir := range rmdirs { 


rmdir() // 清 理 


你 可 能 会 奇怪 ,为 什么 在 循环 体内 将 循环 变量 赋 给 一 个 新 的 局 部 变量 dir， 而 不 是 在 下 
面 这 个 略 有 错误 的 变 体 中 直接 使 用 循环 变量 dir。 


var rmdirs []func() 
for _, dir := range tempDirs() { 


os.MkdirAll(dir，6755) 
rmdirs = append(rmdirs, func() { 
os .RemoveAll(dir) // 不 正确 
}) 
} 
这 个 原因 是 循环 变量 的 作用 域 的 规则 限制 。 在 上 面 的 程序 中 ，dir 在 for 循环 引进 的 一 
个 块 作用 域内 进行 声明 。 在 循环 里 创建 的 所 有 函数 变量 共享 相同 的 变量 一 一 一 个 可 访问 的 
存储 位 置 ， 而 不 是 固定 的 值 。dir 变量 的 值 在 不 断 地 迭代 中 更 新 ， 因 此 当 调 用 清理 函数 时 ， 
dir 变量 已 经 被 每 一 次 的 for 循环 更 新 多 次 。 因 此 ，dir 变量 的 实际 取 值 是 最 后 一 次 迭代 时 的 
值 并 且 所 有 的 os.RemoveAll 调用 最 终 都 试图 删除 同一 个 目录 。 
我 们 经 常 引 入 一 个 内 部 变量 来 解决 这 个 问题 ， 就 像 dir 变量 是 一 个 和 外 部 变量 同名 的 变 
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量 ， 只 不 过 是 一 个 副本 ， 这 看 起 来 有 些 奇 怪 却 是 一 个 关键 性 的 声明 : 


for _, dir := range tempDirs() 
dir := dir // 声明 内 部 dir， 并 以 外 部 dir 初始 化 
WY sii 

} 


这 样 的 隐患 不 仅仅 存在 于 使 用 range 的 for 循环 里 。 在 下 面 的 循环 中 也 面临 由 于 无 意 间 
捕获 的 索引 变量 i 而 导致 的 同样 问题 。 
var rmdirs []func() 
dirs := tempDirs() 
for i := 6; i < len(dirs); i++ { 
Os.MkdirAll(dirs[i], 8755) // OK 
rmdirs = append(rmdirs, func() { 
0s.RemoveAll(dirs[i]) // 不 正确 
}) 
by 
在 go 语句 (参考 第 8 章 ) 和 defer 语句 ( 稍 后 会 看 到 ) 的 使 用 当中 ， 和 迭代 变量 捕获 的 问 
题 是 最 频繁 的 ， 这 是 因为 这 两 个 逻辑 都 会 推迟 函数 的 执行 时 机 ， 直 到 循环 结束 。 但 是 这 个 问 
题 并 不 是 由 go 或 者 defer 语句 造成 的 。 
5.7 ” 变 长 函数 
变 长 函数 被 调用 的 时 候 可 以 有 可 变 的 参数 个 数 。 最 令 人 熟知 的 例子 就 是 fnt.Printf 与 其 
变种 。Printf 需要 在 开头 提供 一 个 固定 的 参数 ， 后 续 便 可 以 接受 任意 数目 的 参数 。 
在 参数 列表 最 后 的 类 型 名 称 之 前 使 用 省 略 号 “…” 表 示 声 明 一 个 变 长 函数 ， 调 用 这 个 函 
数 的 时 候 可 以 传递 该 类 型 任意 数目 的 参数 。 
Bopl1.io/ch5/sum 


func sum(vals ...int) int { 
total := 6 
for _, val := range vals { 


total += val 


} 


return total 


} 


上 面 这 个 sum 函数 返回 零 个 或 者 多 个 int 参数 。 在 函数 体内 ，vals 是 一 个 int 类 型 的 
slice。 调 用 sum 的 时 候 任何 数量 的 参数 都 将 提供 给 vals 参数 。 

fmt.Println(sum()) 0 

fmt.Println(sum(3)) LA a 

fmt.Println(sum(1, 2, 3, 4)) // "18" 

调用 者 显 式 地 申请 一 个 数组 ， 将 实 参 复制 给 这 个 数组 ， 并 把 一 个 数组 slice 传递 给 函数 。 
上 面 的 最 后 一 个 调用 和 下 面 的 调用 的 作用 是 一 样 的 ， 它 展示 了 当 实 参 已 经 存在 于 一 个 slice 
中 的 时 候 如 何 调用 一 个 变 长 函数 : 在 最 后 一 个 参数 后 面 放 一 个 省 略 号 。 

values := []int{f1，2，3，4} 

fmt.Println(sum(values...)) // "16" 

尽管 .….int 参数 就 像 函数 体内 的 slice， 但 变 长 函数 的 类 型 和 一 个 带 有 普通 slice 参数 的 
函数 的 类 型 不 相同 。 

fUne FC.1nt) €{} 

func g([]int) {} 
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fmt.Printf("%T\n", f) // "func(...int)" 

fmt.Printf("%T\n", g) // "func([]Jint)" 

释 长 函数 通常 用 于 格式 化 字符 串 。 下 面 的 errorf 函数 构建 一 条 格式 化 的 错误 消息 ， 在 
消息 的 开头 带 有 行 号 。 函 数 的 后 级 f 是 广泛 使 用 的 命名 习惯 ， 用 于 可 变 长 Printf 风格 的 字符 
串 格 式 化 输出 函数 。 

func errorf(linenum int, format string, args ...interface{}) { 

fmt.Fprintf(os.Stderr, "Line %d: ", linenum) 


fmt.Fprintf(os.Stderr, format, args...) 
fmt.Fprintln(os.Stderr) 


} 


linenum, name := 12, "count" 
errorf(linenum, "undefined: %s", name) // "Line 12: undefined: count" 


interface{} 类 型 意味 着 这 个 函数 的 最 后 一 个 参数 可 以 接受 任何 值 ， 第 7 章 将 解释 它 的 
用 法 。 | 

练习 5.15: 模仿 sum 写 两 个 变 长 函数 max 和 min。 当 不 带 任何 参数 调用 这 些 函 数 时 应 该 
怎么 应 对 ?编写 类 似 函数 的 变种 ， 要 求 至 少 需要 一 个 参数 。 

练习 5.16: 写 一 个 变 长 版 本 的 strings.Join 函数 。 

练习 5.17: 写 一 个 变 长 函数 ElementsByTagname， 已 知 一 个 HTML 节点 树 和 零 个 或 多 个 
名 字 ， 返 回 所 有 符合 给 出 名 字 的 元 素 。 下 面 有 两 个 示例 调用 : 

func ElementsByTagName(doc *html.Node, name ...string) []*html.Node 


images := ElementsByTagName(doc, "img") 
headings := ElementsByTagName(doc, "h1", "h2", "h3", "h4") 


5.8 延迟 函数 调用 


findLinks 示例 使 用 http.Get 的 输出 作为 html.Parse 的 输入 。 如 果 请 求 的 URL 是 HTML 
那么 它 一 定 会 正常 工作 ， 但 是 许多 页 面包 含 图 片 、 文 字 和 其 他 文件 格式 。 如 果 让 HTML 解 
析 融 去 解析 这 类 文件 可 能 会 发 生意 料 外 的 状况 。 

下 面 的 程序 获取 一 个 HTML 文档 然后 输出 它 的 标题 。title 函数 检测 从 服务 器 端 回 的 
Content-Type 头 部 ， 如 果 文 档 不 是 HTML 则 返回 错误 。 


gopl1.io/ch5/titlel 
func title(url string) error { 
resp, err := http.Get(url) 
if err != nil { 
return err 


} 


// 检查 Content-Type 是 HTML (如 "text/html; charset=utf-8") 
ct := resp.Header.Get("Content-Type") 
if ct != "text/html" && !strings.Hasprefix(ct, "text/html;") { 
resp.Body.Close() 
return fmt.Errorf("%s has type %s, not text/html", url, ct) 
} 


doc, err := html.Parse(resp.Body) 
resp.Body.Close() 
if err != nil { 
return fmt.Errorf("parsing %s as HTML: %v", url, err) 


} 
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doc, err := html.Parse(resp.Body) 
resp.Body.Close() 
if err != nil { 
return fmt.Errorf("parsing %s as HTML: %v", url, err) 


} 


visitNode := func(n *html.Node) { 
if n.Type == html.ElementNode && n.Data == "title" && 
n.FirstChild != nil { 
fmt.Println(n.FirstChild.Data) 
} 


forEachNode(doc, visitNode, nil) 
return nil 


} 
下 面 是 稍稍 编辑 后 的 命令 行 会 话 示例 : 


$ go build gop1.io/ch5/titlel1 
$ ./titlel http://gopl.io 
The Go Programming Language 
$ ./titlel https://golang.org/doc/effective_go.html 
Effective Go - The Go.Programming Language 
$ ./titlel https://golang.org/doc/gopher/frontpage.png 
title: https://golang.org/doc/gopher/frontpage.png 
has type image/png, not text/html 


观察 重复 的 resp.Body.close() 调用 ， 它 保证 title 函数 在 任何 执行 路 径 下 都 会 关闭 网 络 
连接 ， 包 括 发 生 错误 的 情况 。 随 着 函数 变 得 越 来 越 复杂 ， 并 且 需 要 处 理 更 多 的 错误 情况 ， 这 
样 一 种 重复 的 清理 动作 会 造成 之 后 的 维护 问题 。 我 们 看 看 Go 语言 的 defer 机 制 怎 样 让 这 些 
工作 变 得 更 简单 。 

语法 上 ， 一 个 defer 语句 就 是 一 个 普通 的 函数 或 方法 调用 ， 在 调用 之 前 加 上 关键 字 
defer。 困 数 和 参数 表达 式 会 在 语句 执行 时 求 值 ， 但 是 无 论 是 正常 情况 下 ， 执 行 return 语句 
或 函数 执行 完毕 ， 还 是 不 正常 的 情况 下 ， 比 如 发 生 宕 机 ， 实 际 的 调用 推迟 到 包含 defer 语句 
的 函数 结束 后 才 执 行 。defer 语句 没有 限制 使 用 次 数 ; 执行 的 时 候 以 调用 defer 语句 顺序 的 
倒序 进行 。 

defer 语句 经 常 使 用 于 成 对 的 操作 ， 比 如 打开 和 关闭 ， 连 接 和 断 开 ， 加 锁 和 解锁， 即使 是 
再 复杂 的 控制 流 ， 资 源 在 任何 情况 下 都 能 够 正确 释放 。 正 确 使 用 defer 语句 的 地 方 是 在 成 功 获 
得 资源 之 后 。 在 下 面 的 title 函数 ， 一 个 推迟 的 调用 替换 了 先前 的 resp.Body.close() 调用 : 

gopl.io/ch5/title2 


func title(url string) error { 
resp, err := http.Get(url) 
if err != nil { 
return err 
} 
defer resp.Body.Close() 


ct := resp.Header.Get("Content-Type") 
if ct != "text/html" && !strings.HasPrefix(ct, "text/html;") { 
return fmt.Errorf("%s has type %s, not text/html", url, ct) 


} 
doc, err := html.Parse(resp.Body) 
if err != nil { 


return fmt.Errorf("parsing %s as HTML: %v", url, err) 


} 
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// .…. 输 出 文档 的 标题 元 素 ,.. 


return nil 


} 
同样 的 方法 可 以 使 用 在 其 他 资源 (包括 网 络 连 接 ) 上 ， 比 如 关闭 一 个 打开 的 文件 : 
io/ioutil 


package ioutil 


func ReadFile(filename string) ([]byte，error) { 
f, err := 0s.0pen(filename) 
if err l= nil { 
Peturn nil, err 


} 

defer f.Close() 

return ReadAll(f) 
} 


或 者 解锁 一 个 互 斥 锁 (参考 9.2 节 ): 


Var mu sync.Mutex 
var m = make(map[string]int) 
func lookup(key string) int { 
mu.Lock() 
defer mu.Unlock() 
return m[key] 


} 


defer 语句 也 可 以 用 来 调试 一 个 复杂 的 函数 ， 即 在 函数 的 “入 口 ” 和 “出 口 ” 处 设置 调 
斌 行为。 下面 的 bigslowoperation 晴 数 在 开头 调用 trace 函数 ， 在 函数 刚 进 入 的 时 候 执行 输 
出 ， 然 后 返回 一 个 函数 变量 ， 当 其 被 调用 的 时 候 执行 退出 函数 的 操作 。 以 这 种 方式 推迟 返回 
函数 的 调用 ,我们 可 以 使 用 一 个 语句 在 函数 入 口 和 所 有 出 口 添加 处 理 ， 其 至 可 以 传递 一 些 有 
用 的 值 ， 比 如 每 个 操作 的 开始 时 间 。 但 别 忘 了 defer 语句 末尾 的 圆 括号 ， 否 则 入 口 的 操作 会 
在 函数 退出 时 执行 而 出 口 的 操作 永远 不 会 调用 ! 
gopl.io/ch5/trace 
func bigSlowOperation() { 
defer trace("bigSlowOperation")() // 别 忘记 这 对 圆 括号 
// .…. 这 里 是 一 些 处 理 ... 


time.Sleep(16 * time.Second) // 通过 休眠 仿真 慢 操 作 
} 


func trace(msg string) func() { 

start := time.Now() 

log.Printf("enter %s", msg) 

return func() { log.Printf("exit %s (%s)", msg, time.Since(start)) } 
. 


每 次 调用 bigslowoperation， 它 会 记录 进入 函数 入 口 和 出 口 的 时 间 与 两 者 之 间 的 时 间 差 。 
(我 们 使 用 time.sleep 来 模拟 一 个 长 时 间 的 操作 。) 


$ go build gopl.io/ch5/trace 

$ ./trace 

2615/11/18 69:53:26 enter bigSlowOperation 

2615/11/18 69:53:36 exit bigSlowOperation (16.666589217s) 


延迟 执行 的 函数 在 return 语句 之 后 执行 ， 并 且 可 以 更 新 函数 的 结果 变量 。 因 为 匿名 函 
数 可 以 得 到 其 外 层 函 数 作用 域内 的 变量 (包括 命名 的 结果 )， 所 以 延迟 执行 的 匿名 函数 可 以 
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观察 到 函数 的 返回 结果 。 
考虑 下 面 的 函数 double: 


func double(x int) int { 
return X + X 


J 


通过 命名 结果 变量 和 增加 defer 语句 ， 我 们 能 够 在 每 次 调用 函数 的 时 候 输 出 它 的 参数 和 
结果 。 


func double(x int) (result int) { 
defer func() { fmt.Printf("double(%d) = %d\n", x, result) }() 
return x+x 


} 
_ = double(4) 
// 输出 : 
// "double(4) = 8" 
这 个 技巧 的 使 用 相 比 之 前 的 double 函数 来 说 有 些 过 了 ,但 对 于 有 很 多 返回 语句 的 函数 
来 说 很 有 帮助 。 
延迟 执行 的 匿名 函数 能 够 改变 外 层 函 数 返回 给 调用 者 的 结果 : 
func triple(x int) (result int) { 
defer func() { result += x }() 
return double(x) 


} 
fmt.Println(triple(4)) // "12" 


因为 延迟 的 函数 不 到 函数 的 最 后 一 刻 是 不 会 执行 的 。 要 注意 循环 里 defer 语句 的 使 用 。 
下 面 的 这 段 代 码 就 可 能 会 用 尽 所 有 的 文件 描述 符 ， 这 是 因为 处 理 完 成 后 却 没有 文件 关闭 -。 


for _, filename := range filenames { 
f, err := 0s.0pen(filename) 
if err != nil { 
return err 


} 
defer f.Close() // 注意 : 可 能 会 用 尽 文件 描述 符 
// .… .处理 文 件 . . . 

} 


一 种 解决 的 方式 是 将 循环 体 (包括 defer 语句 ) 放 到 男 一 个 函数 里 ， 每 此 循环 迭代 都 会 
调用 文件 关闭 函数 。 


for _, filename := range filenames { 
if err := doFile(filename); err != nil { 
return err 
} 
J 


func doFile(filename string) error { 
f, err := 0s.0pen(filename) 
if err != nil { 
return err 
} 
defer f.Close() 
XA 处 理 交 件 iwmss 
} 


下 面 这 个 例子 是 改进 过 的 fetch 程序 (参见 1.5 节 ),， 将 HTTP 的 响应 写 到 本 地 文件 中 而 
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不 是 直接 显示 在 标准 输出 中 。 它 使 用 path.Base 函数 获得 URL 人 
文件 名 。 


gopl.io/chs/fetch 
// Fetch 下 载 URL 并 返回 本 地 文件 的 名 字 和 长 度 
func fetch(url string) (filename string, n int64, err error) { 
resp, err := http.Get(url) 
if err != nil { 
return "", 6, err 


} 
defer resp.Body.Close() 


1l0cal 3 PS Base(resp. Request .URL .Path) 
if Tocal = 
local = "index.html" 


} 
f, err := 0s.Create(local) 
if err != nil { 


return "", 0, err 


n, err = io.Copy(f, resp.Body) 

// 关闭 文件 ， 并 保留 错误 消息 

if closeErr := f.Close(); err == nil 本 
err = closeErr 


} 


return local, n, err 


} 


现在 应 该 熟悉 延迟 调用 的 resp.Body.close 了 。 在 这 个 例 程 中 ， 如 果 试 图 使 用 延迟 调用 
f.Close 去 关闭 一 个 本 地 文件 就 会 有 些 问题 ， 因 为 os.create 打开 了 一 个 文件 对 其 进行 写 人 、 
创建 。 在 许多 文件 系统 中 ， 尤 其 是 NFS， 写 错误 往往 不 是 立即 返回 而 是 推迟 到 文件 关闭 的 
时 候 。 如 果 无 法 检查 关闭 操作 的 结果 ， 就 会 导致 一 系列 的 数据 丢失 。 然 而 ， 如 果 io.copy 和 
f.Close 同时 失败 ， 我 们 更 加 倾向 于 报告 io.copy 的 错误 ， 因 为 它 发 生 在 前 ， 更 有 可 能 告 所 
们 失败 的 原因 是 什么 。 

练习 5.18: 不 改变 原本 的 行为 ， 重 写 fetch 函数 以 使 用 defer 语句 关闭 打开 的 可 写 的 文件 。 


5.9 容 机 


o 语 言 的 类 型 系统 会 捕获 许多 编译 时 错误 ， 但 有 些 其 他 的 错误 (比如 数组 越界 访问 或 
es nl 都 需要 在 运行 时 进行 检查 。 当 Go 语言 运行 时 检测 到 这 些 错 误 ， 它 就 会 发 
生 宕 机 。 
一 个 典型 的 宕 机 发 生 时 ， 正 常 的 程序 执行 会 终止 ，goroutine 中 的 所 有 延迟 函数 会 执行 ， 
后 程序 会 异常 退出 并 留 下 一 条 日 志 消息 。 日 志 消 息 包括 宕 机 的 值 ， 这 往往 代表 某 种 错误 
消息 ， 每 一 个 goroutine 都 会 在 宕 机 的 时 候 显 示 一 个 函数 调用 的 栈 跟踪 消息 。 通常 可 以 借助 
这 条 日 志 消 息 来 诊断 问题 的 原因 而 不 需要 再 一 次 运行 该 程序 ， 因此 报告 一 个 发 生 宕 机 的 程序 
bug 时 ， 总 是 会 加 上 这 条 消息 。 
并 不 是 所 有 宕 机 都 是 在 运行 时 发 生 的 。 可 以 直接 调用 内 置 的 宕 机 函数 ; 内 置 的 宕 机 函数 
可 以 接受 任何 值 作为 参数 。 如 果 碰 到 “不 可 能 发 生 ” 的 状况 ， 宕 机 是 最 好 的 处 理 方式 ， 比 如 
语句 执行 到 逻辑 上 不 可 能 到 达 的 地 方 时 : 


流 
以 
地 
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switch s := suit(drawCard()); s{ 


case "Spades": A 
case "Hearts": VR 
case "Diamonds": // ... 
case "Clubs": A wns 
default: 


panic(fmt.Sprintf("invalid suit %q"，s)) // 宕 机 了 吗 


设置 函数 的 断言 是 一 个 良好 的 习惯 ， 但 是 这 也 会 带 来 多 余 的 检查 。 除 非 你 能 够 提供 有 效 
的 错误 消息 或 者 能 够 很 快 地 检测 出 错误 ， 否 则 在 运行 时 检测 断言 条 件 就 毫 无 意义 。 


func Reset(x *Buffer) { 
if x == nil { 
panic("x is nil") // 没 必 要 


x.elements = nil 

} 

尽管 Go 语言 的 宕 机 机 制 和 其 他 语言 的 异常 很 相似 ,但 宕 机 的 使 用 场景 不 尽 相 同 。 由 于 
宕 机 会 引起 程序 异常 退出 ， 因 此 只 有 在 发 生 严 重 的 错误 时 才 会 使 用 宕 机 ， 比 如 遇 到 与 预想 的 
逻辑 不 一 致 的 代码 ; 用 心 的 程序 员 会 将 所 有 可 能 会 发 生 异常 退出 的 情况 考虑 在 内 以 证 实 bug 
的 存在 。 强 健 的 代码 会 优雅 地 处 理 “ 预 期 的 ”错误 ， 比 如 错误 的 输入 、 配 置 或 者 IO 失败 等 ; 
这 时 最 好 能 够 使 用 错误 值 来 加 以 区 分 。 

考虑 函数 regexp.compile， 它 编译 了 一 个 高 效 的 正则 表达 式 。 如 果 调 用 时 给 的 模式 参数 
不 合法 则 会 报错 ,但 是 检查 这 个 错误 本 身 没有 必要 上 且 相当 烦琐 ,因为 调用 者 知道 这 个 特定 的 
调用 是 不 会 失败 的 。 在 此 情况 下 ,使 用 宕 机 来 处 理 这 种 不 可 能 发 生 的 错误 是 比较 合理 的 。 

由 于 大 部 分 的 正则 表达 式 是 字面 量 ， 因 此 regexp 包 提供 了 一 个 包装 函数 regexp. 
MustCompile 进行 这 个 检查 : 


package regexp 


func Compile(expr string) (*Regexp, error) { /* ... */ } 
func MustCompile(expr string) *Regexp { 

re, err := Compile(expr) 

if err != nil { 

panic(err) 

} 

return re 
} 


包装 函数 使 得 初始 化 一 个 包 级 别 的 正则 表达 式 变量 ( 带 有 一 个 编译 的 正则 表达 式 ) 变 得 
更 加 方便 ， 如 下 所 示 : 

var httpSchemeRE = regexp.MustCompile(`^https?: ) // "http:" 或 "https:" 

当然 ，Mustcompile 不 应 该 接收 到 不 正确 的 值 。 前 缀 Must 是 这 类 函数 一 个 通用 的 命名 习 
惯 ， 比 如 4.6 节 介 绍 的 template.Must。 

当 容 机 发 生 时 ， 所 有 的 延迟 函数 以 倒序 执行 ， 从 栈 最 上 面 的 函数 开始 一 直 返 回 至 main 
函数 ， 如 下 面 的 程序 所 示 : 


gopl1.io/ch5/defer1 
func main() { 
f(3) 
} 
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func f(x int) { 
fmt.Printf("f(%d)\n"，x+6/x) // panics if x ==6 则 发 生 宕 机 
defer fmt.Printf("defer %d\n", x) 
f(x - 1) 

} 


运行 的 时 候 ， 程 序 会 输出 下 面 的 内 容 到 标准 输出 。 


f(3) 
f(2) 
f(1) 
defer 1 
defer 2 
defer 3 


当 调 用 f(e) 的 时 候 会 发 生 宕 机 ， 会 执行 三 个 延迟 的 fmt.printf 调用 。 之 后 ， 运 行 时 终 
止 了 这 个 程序 ， 输 出 罕 机 消息 与 一 个 栈 转 储 信息 到 标准 错误 流 (输出 内 容 有 省 略 )。 


panic: runtime error: integer divide by zero 
main.f(6) 
src/gopl.io/ch5/defer1/defer.go:14 
main.f(1) 
src/gopl.io/ch5/defer1i/defer.go0:16 
main.f(2) 
src/gopl.io/ch5/defer1/defer.g0:16 
main.f(3) 
src/gopl.io/ch5/defer1/defer.go:16 
main.main() 
src/gopl.io/ch5/defer1l/defer.go:10 


之 后 会 看 到 ， 气 数 是 可 以 从 宕 机 状态 恢复 至 正常 运行 状态 而 不 让 程序 退出 。 
runtime 包 提 供 了 转 储 栈 的 方法 使 程序 员 可 以 诊断 错误 。 下 面 代码 在 main 函数 中 延迟 
printstack 的 执行 ， 


gopl.io/chs/defer2 
func main() { 
defer printstack() 
f(3) 
} 


func printstack() { 
var buf [4696]byte 
n := runtime.Stack(buf[:], false) 
0s.Stdout.Write(buf[:n]) 

} 


下 面 的 额外 信息 (同样 经 过 简化 处 理 ) 输出 到 标准 输出 中 : 


goroutine 1 [running]: 
main.printSstack() 
src/gopl.io/ch5/defer2/defer.go:20 
main.f(0) 
src/gopl.io/ch5/defer2/defer.go:27 
main.f(1) 
src/gopl.io/ch5/defer2/defer.go:29 
main.f(2) 
src/gopl.io/ch5/defer2/defer.go:29 
main.f(3) 
src/gopl.io/ch5/defer2/defer.go:29 
main.main() 
src/gopl.io/ch5/defer2/defer.go:15 
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熟悉 其 他 语言 的 异常 机 制 的 读者 可 能 会 对 runtime.stack 能 够 输出 函数 栈 信息 感到 吃惊， 
因为 栈 应 该 已 经 不 存在 了 。 但 事实 上 ，Go 语言 的 宕 机 机 制 让 延迟 执行 的 函数 在 栈 清理 之 前 
调用 。 


5.10 恢复 


退出 程序 通常 是 正确 处 理 宕 机 的 方式 ， 但 也 有 例外 。 在 一 定 情况 下 是 可 以 进行 恢复 的 ， 
至 少 有 时 候 可 以 在 退出 前 理 清 当前 混乱 的 情况 。 比 如 ， 当 Web 服务 器 遇 到 一 个 未 知 错误 时 ， 
可 以 先 关闭 所 有 连接 ， 这 总 比 让 客户 端 阻塞 在 那里 要 好 ， 而 在 开发 过 程 中 ， 也 可 以 向 客户 站 
汇报 当前 遇 到 的 错误 。 

如 果 内 置 的 recover 函数 在 延迟 函数 的 内 部 调用 ， 而 且 这 个 包含 defer 语句 的 函数 发 生 
宕 机 ，recover 会 终止 当前 的 罕 机 状态 并 且 返 回 宕 机 的 值 。 函 数 不 会 从 之 前 宕 机 的 地 方 继续 
运行 而 是 正常 返回 。 如 果 recover 在 其 他 任何 情况 下 运行 则 它 没有 任何 效果 且 返 回 nil。 

为 了 说 明 这 一 点 ， 假 设 我 们 开发 一 种 语言 的 解析 器 。 即 使 它 看 起 来 运行 正常 ， 但 考虑 到 
工作 的 复杂 性 ， 还 是 会 存在 只 在 特殊 情况 下 发 生 的 bug。 我 们 在 这 时 会 更 喜欢 将 本 该 宕 机 的 
错误 看 作 一 个 解析 错误 ， 不 要 立即 终止 运行 ， 而 是 将 一 些 有 用 的 附加 消息 提供 给 用 户 来 报告 
这 个 bug。 


func Parse(input string) (s *Syntax, err error) { 
defer func() { 
if p := recover(); p != nil { 
err = fmt.Errorf("internal error: %v", p) 


t 
}() 
// .…. 解 析 器 ,.. 


parse 函数 中 的 延迟 函数 会 从 宕 机 状态 恢复 ， 并 使 用 宕 机 值 组 成 一 条 错误 消息 ; 理想 的 
写法 是 使 用 runtime.stack 将 整个 调用 栈 包含 进来 。 延 迟 函数 则 将 错误 赋 给 err 结果 变量 ， 
从 而 返回 给 调用 者 。 

对 于 宕 机 采用 无 差别 的 恢复 措施 是 不 可 靠 的 ， 因 为 宕 机 后 包 内 变量 的 状态 往往 没有 清晰 
的 定义 和 解释 。 可 能 是 对 某 个 关键 数据 结构 的 更 新 错误 ， 文 件 或 网 络 连接 打开 而 未 关闭 ， 或 
者 获得 了 锁 却 没有 释放 。 长 此 以 往 ， 把 异常 退出 变 为 简单 地 输出 一 条 日 志 会 使 真正 的 bug 难 
于 发 现 。 

从 同一 个 包 内 发 生 的 宕 机 进行 恢复 有 助 于 简化 处 理 复杂 和 未 知 的 错误 ， 但 一 般 的 原则 
是 ， 你 不 应 该 尝试 去 恢复 从 另 一 个 包 内 发 生 的 宕 机 。 公 共 的 API 应 当 直 接 报告 错误 。 同 样 ， 
你 也 不 应 该 恢复 一 个 宕 机 ， 而 这 段 代 码 却 不 是 由 你 来 维护 的 ， 比 如 调用 者 提供 的 回调 函数 ， 
因为 你 不 清楚 这 样 做 是 否 安全 。 

举 个 例子 ，net/http 包 提 供 一 个 Web 服务 器 ， 后 者 能 够 把 请 求 分 配给 用 户 定义 的 处 理 孙 
数 。 与 其 让 这 些 处 理 函 数 中 的 宕 机 使 得 整个 进程 退出 ， 不 如 让 服务 器 调用 recover， 输 出 栈 
跟踪 信息 ， 然 后 继续 工作 。 但 是 这 样 使 用 会 有 一 定 的 风险 ， 比 如 导致 资源 泄露 或 使 失败 的 处 
理 函 数 处 于 未 定义 的 状态 从 而 导致 其 他 问题 。 

出 于 上 面 的 原因 ， 最 安全 的 做 法 还 是 要 选择 性 地 使 用 recover。 换 句 话 说， 在 宕 机 过 后 
需要 进行 恢复 的 情况 本 来 就 不 多 。 可 以 通过 使 用 一 个 明确 的 、 非 导出 类 型 作为 宕 机 值 ， 之 后 
检测 recover 的 返回 值 是 否 是 这 个 类 型 (后面 会 看 到 这 个 例子 )。 如 果 是 这 个 类 型 ， 可 以 像 普 
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通 的 error 那样 处 理 宕 机 ; 如 果 不 是 ， 使 用 同一 个 参数 调用 panic 以 继续 触发 宕 机 。 
下 面 的 例子 是 title 程序 的 变 体 ， 如 果 HTML 文档 包含 多 个 <tit1le> 元 素 则 会 报错 。 如 
果 这 样 ， 程 序 会 通过 调用 panic 并 传递 一 个 特殊 的 类 型 bailout 作为 参数 退出 递归 。 


gopl1.io/chs/title3 
// soleTitle 返回 文档 中 第 一 个 非 空 标题 元 素 
// 如 果 没 有 标题 则 返回 错误 
func soleTitle(doc *html.Node) (title string, err error) { 
type bailout struct{} 


defer func() { 
switch p := recover(); pi{ 
case nil: 
// 没有 客机 
case bailout{}: 
//“" 预 期 的 " 宕 机 
err = fmt.Errorf("multiple title elements") 
default: 
panic(p) // 未 预期 的 宕 机 ; 继续 宕 机 过 程 


}() 
// 如 果 发 现 多 余 一 个 非 空 标题 ， 退 出 递归 
forEachNode(doc, func(n *html.Node) { 
if n.Type == html.ElementNode && n.Data == "title" && 
n.FirstChild != nil { 
if title != "" { 
panic(bailout{}) // 多 个 标题 元 素 
} 
title = n.FirstChild.Data 


Be 
}, nil) 
if title == "" { 
return "", fmt.Errorf("no title element") 


return title, nil 


} 

延迟 的 处 理 函 数 调用 recover， 检 查 宕 机 值 ， 如 果 该 值 是 bailout{} 则 返回 一 个 普通 的 
错误 。 所 有 其 他 非 空 的 值 则 说 明 是 预料 外 的 宕 机 ， 这 时 处 理 函数 使 用 这 个 值 作为 参数 调用 
panic， 忽 略 recover 的 作用 并 且 继 续 之 前 的 宕 机 状态 (这 个 示例 虽然 违反 了 宕 机 不 处 理 “ 预 
期 ”错误 的 建议 , 但 是 它 简 洁 地 展现 了 这 种 机 制 )。 

有 些 情况 下 是 没有 恢复 动作 的 。 比 如 ， 内 存 耗 尽 使 得 Go 运行 时 发 生 严重 错误 而 直接 终 
止 进程 。 

练习 5.19 : 使 用 panic 和 recover 写 一 个 函数 ， 它 没有 return 语句 ， 但 是 能 够 返回 一 个 
非 零 的 值 。 
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从 20 世纪 90 年 代 初 开始 ， 面 向 对 象 编程 (OOP) 的 编程 思想 就 已 经 在 工业 领域 和 教学 
领域 占据 了 主导 位 置 ， 而 且 几 乎 所 有 广泛 应 用 的 编程 语言 都 支持 了 这 种 思想 。Go 语言 也 不 
例外 。 

尽管 没有 统一 的 面向 对 象 编程 的 定义 ， 对 我 们 来 说 ， 对 象 就 是 简单 的 一 个 值 或 者 变量 ， 
并 且 拥 有 其 方法 ， 而 方法 是 某 种 特定 类 型 的 函数 。 面 向 对 象 编程 就 是 使 用 方法 来 描述 每 个 数 
据 结构 的 属性 和 操作 ， 于 是 ， 使 用 者 不 需要 了 解 对 象 本 身 的 实现 。 

在 之 前 的 章节 ， 我 们 了 解 了 标准 库 中 方法 的 常规 使 用 方法 ， 比 如 time.Duration 类 型 的 
seconds 方法 。 


const day = 24 * time.Hour 
fmt.Println(day.Seconds()) // “86466" 


而 且 2.5 节 定 义 了 我 们 自己 的 一 个 方法 ， 为 celsius 类 型 定义 了 String 方法 : 
func (c Celsius) String() string { return fmt.Sprintf("%g°C", c) } 


在 这 一 章 中 ， 首 先 我 们 要 学 习 如 何 基于 面向 对 象 编程 思想 ， 从 而 更 有 效 地 定义 和 使 用 方 
法 。 我 们 也 会 讲 到 两 个 关键 的 原则 : 封装 和 组 合 。 


6.1 方法 声明 
方法 的 声明 和 普通 函数 的 声明 类 似 ， 只 是 在 函数 名 字 前 面 多 了 一 个 参数 。 这 个 参数 把 这 
个 方法 绑 定 到 这 个 参数 对 应 的 类 型 上 。 
让 我 们 现在 尝试 在 一 个 与 平面 几何 相关 的 包 中 写 第 一 个 方法 : 
gopl.io/ch6/geometry 
package geometry 
import “math” 
type Point struct{ X, Y float64 } 


// 普通 的 函数 

func Distance(p，q Point) float64 { 
return math.Hypot(q.X-p.X, q.Y-p.Y) 

} 


// Point 类 型 的 方法 

func (p Point) Distance(q Point) float64 { 
return math.Hypot(q.X-p.X, q.Y-p.Y) 

} 


附加 的 参数 p 称 为 方法 的 接收 者 ， 它 源 自 早先 的 面向 对 象 语言 ， 用 来 描述 主 调 方法 就 像 
向 对 象 发 送 消息 。 

Go 语言 中 ， 接 收 者 不 使 用 特殊 名 (比如 this 或 者 self) ; 而 是 我 们 自己 选择 接收 者 名 字 ， 
就 像 其 他 的 参数 变量 一 样 。 由 于 接收 者 会 频繁 地 使 用 ， 因 此 最 好 能 够 选择 简短 且 在 整个 方法 
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中 名 称 始终 保持 一 致 的 名 字 。 最 常用 的 方法 就 是 取 类 型 名 称 的 首 字母 ， 就 像 point 中 的 p。 
调用 方法 的 时 候 ， 接 收 者 在 方法 名 的 前 面 。 这 样 就 和 声明 保持 一 致 。 


Pointtl;2} 
q := Point{4, 6} 
fmt.Println(Distance(p,，9q)) // "5"， 函 数 调用 
fmt.Println(p.Distance(q)) // "5"，, 方法 调用 


上 面 两 个 Distance 函数 声明 没有 冲突 。 第 一 个 声明 一 个 包 级 别 的 函数 ( 称 为 geometry. 
Distance)。 第 二 个 声明 一 个 类 型 point 的 方法 ， 因 此 它 的 名 字 是 Point.Distance。 

表达 式 p.Distance 称 作 选择 子 ( selector)， 因 为 它 为 接收 者 p 选择 合适 的 Distance 方法 。 
选择 子 也 用 于 选择 结构 类 型 中 的 某 些 字段 值 ， 就 像 p.x 中 的 字段 值 。 由 于 方法 和 字段 来 自 于 
间 一 个 命名 空间 ， 因 此 在 Point 结构 类 型 中 声明 一 个 叫 作 x 的 方法 会 与 字段 x 冲突 ， 编 译 器 
会 报错 。 

因为 每 一 个 类 型 有 它 自 己 的 命名 空间 ， 所 以 我 们 能 够 在 其 他 不 同 的 类 型 中 使 用 名 字 
Distance 作为 方法 名 。 定 义 一 个 Path 类 型 表示 一 条 线段 ， 同 样 也 使 用 Distance 作为 方法 名 。 


// Path 是 连接 多 个 点 的 直线 段 
type Path []Point 
// Distance 方法 返回 路 径 的 长 度 
func (path Path) Distance() float64 { 
sum := 0.6 
for i := range path { 
让 垢 直 
sum += path[i-1].Distance(path[i]) 
} 
} 


return sum 


} 
Path 是 一 个 命名 的 slice 类 型 ， 而 非 Point 这 样 的 结构 体 类 型 ， 但 我 们 依旧 可 以 给 它 定 
义 方法 。Go 和 许多 其 他 面向 对 象 的 语言 不 同 ， 它 可 以 将 方法 绑 定 到 任何 类 型 上 。 可 以 很 方 
便 地 为 简单 的 类 型 (如 数字 、 字 符 串 、slice 、map， 甚 至 函数 等 ) 定义 附加 的 行为 。 同 一 个 
包 下 的 任何 类 型 都 可 以 声明 方法 ， 只 要 它 的 类 型 既 不 是 指针 类 型 也 不 是 接口 类 型 。 
这 两 个 Distance 方 法 拥有 不 同 的 类 型 。 它 们 彼此 无 关 ， 尽 管 path.Distance 在 内 部 使 用 
Point.Distance 来 计算 线段 相 邻 点 之 间 的 距离 。 
调用 这 个 新 的 方法 计算 右边 三 角形 的 周 长 。 
perim := Path{ 
{1, 1}, 
{5, 1}, 


{5, 4}, 
{Ls 





} 
fmt.Println(perim.Distance()) // "12" 


上 面 两 个 Distance 方法 调用 中 ， 编 译 器 会 通过 方法 名 和 接收 者 的 类 型 决定 调用 哪 一 个 
函数 。 在 第 一 个 示例 中 ，path[i-1] 是 point 类 型 ， 因 此 调用 Point.pistance; 在 第 二 个 示例 ， 
perim 是 Path 类 型 ， 因 此 调用 Path.Distance。 

类 型 拥有 的 所 有 方法 名 都 必须 是 唯一 的 ， 但 不 同 的 类 型 可 以 使 用 相同 的 方法 名 ， 比 
如 Point 和 Path 类 型 的 pistance 方 法 ; 也 没有 必要 使 用 附加 的 字段 来 修饰 方法 名 (比如 ， 
PathDistance) 以 示 区 别 。 这 里 我 们 可 以 看 到 使 用 方法 的 第 一 个 好 处 : 命名 可 以 比 函 数 更 简 


122 | 务 6 间 


短 。 在 包 的 外 部 进行 调用 的 时 候 ， 方 法 能 够 使 用 更 加 简短 的 名 字 且 省 略 包 的 名 字 : 
import "gopl.io/ch6/geometry" 


perim := geometry.Path{{1, 1}, {5, 1}, {5, 4}, {1, 1}} 
fmt.Println(geometry.PathDistance(perim)) // "12"， 独 立 函 数 
fmt.Println(perim.Distance()) //“"12"，geometry .Path 的 方法 


6.2 ”指针 接收 者 的 方法 


由 于 主 调 函 数 会 复制 每 一 个 实 参 变量 ， 如 果 函 数 需要 更 新 一 个 变量 ,或 者 如 果 一 个 实 参 
太 大 而 我 们 希望 避免 复制 整个 实 参 ， 因 此 我 们 必须 使 用 指针 来 传递 变量 的 地 址 。 这 也 同样 适 
用 于 更 新 接收 者 : 我 们 将 它 绑 定 到 指针 类 型 ， 比 如 *Point。 

func (p *Point) ScaleBy(factor float64) { 

p.X *= factor 
p.Y *= factor 

} 

这 个 方法 的 名 字 是 (*point).scaleBgy。 圆 括号 是 必需 的 ; 没有 圆 括号 ， 表 达 式 会 被 解析 
为 *(Point.ScaleBy)。 

在 真实 的 程序 中 ， 习 惯 上 遵循 如 果 point 的 任何 一 个 方法 使 用 指针 接收 者 ， 那么 所 有 的 
Point 方法 都 应 该 使 用 指针 接收 者 ， 即 使 有 些 方 法 并 不 一 定 需 要 。 我 们 在 Point 中 打破 了 这 
个 习惯 只 为 了 方便 展示 方法 的 不 同 使 用 方法 。 

命名 类 型 (Point) 与 指向 它们 的 指针 ( *Point) 是 唯一 可 以 出 现在 接收 者 声明 处 的 类 型 。 
而 且 ， 为 防止 混淆 ， 不 允许 本 身 是 指针 的 类 型 进行 方法 声明 : 

type P *int 

func (P) f() { /* ... */ } // 编译 错误 : 非法 的 接收 者 类 型 

通过 提供 *Point 能 够 调用 (*Point).scaleBy 方法 ， 比 如: 


r := &Point{1, 2} 
r.ScaleBy(2) 
fmt.Println(*r) // "{2, 4}" 


或 者 : 
p := Point{1, 2} 
pptr := &p 


pptr.ScaleBy(2) 
fmt.Println(p) // "{2, 4}" 


或 者 : 
p := Point{1, 2} 


(&p) .ScaleBy(2) 
fmt.Println(p) // "{2, 4}" 


但 是 最 后 两 个 用 法 虽然 看 上 去 比较 别扭 ， 但 也 是 合法 的 。 如 果 接 收 者 p 是 Point 类 型 的 
变量 ， 但 方法 要 求 一 个 *Point 接收 者 ， 我 们 可 以 使 用 简写 : 

p.ScaleBy(2) 

实际 上 编译 器 会 对 变量 进行 &p 的 隐 式 转换 。 只 有 变量 才 人 允许 这 么 做 ,包括 结 构 体 字段 ， 
像 p.x 和 数组 或 者 slice 的 元 素 ， 比 如 perim[8]。 不 能 够 对 一 个 不 能 取 地 址 的 Point 接收 者 参 
数 调用 *Point 方法 ， 因 为 无 法 获取 临时 变量 的 地 址 。 





Point{1，2}.ScaleBy(2) // 编译 错误 : 不 能 获得 Point 类 型 字面 量 的 地 址 


但 是 如 果实 参 接 收 者 是 *point 类 型 ， 以 Point.Distance 的 方式 调用 Point 类 型 的 方法 是 
合法 的 ， 因 为 我 们 有 办 法 从 地 址 中 获取 Point 的 值 ; 只 要 解 引 用 指向 接收 者 的 指针 值 即 可 。 
编译 器 自动 插入 一 个 隐 式 的 * 操作 符 。 下 面 两 个 函数 的 调用 效果 是 一 样 的 : 


pptr.Distance(q) 
(*pptr).Distance(q) 


让 我 们 总 结 一 下 这 些 例子 ， 因 为 经 常 容易 和 弄 错 。 在 合法 的 方法 调用 表达 式 中 ， 只 有 符合 
下 面 三 种 形式 的 语句 才能 够 成 立 。 
实 参 接 收 者 和 形 参 接收 者 是 同一 个 类 型 ， 比 如 都 是 T 类 型 或 都 是 *T 类 型 ; 


Point{1, 2}.Distance(q) // Point 
pptr.ScaleBy(2) // *Point 


或 者 实 参 接收 者 是 T 类 型 的 变量 而 形 参 接收 者 是 *T 类 型 。 编 译 器 会 隐 式 地 获取 变量 的 
地 址 。 


p.ScaleBy(2) // 隐 式 转换 为 (&p) 

或 者 实 参 接收 者 是 *T 类 型 而 形 参 接收 者 是 T 类 型 。 编 译 器 会 隐 式 地 解 引用 接收 者 ， 获 
得 实际 的 取 值 。 

pptr.Distance(q) // 隐 式 转换 为 (*pptr) 


如 果 所 有 类 型 T 方 法 的 接收 者 是 T 自 己 〈 而 非 *T)， 那 么 复制 它 的 实例 是 安全 的 ; 调用 
方法 的 时 候 都 必须 进行 一 次 复制 。 比 如 ，time.Duration 的 值 在 作为 实 参 传递 到 函数 的 时 候 就 
会 复制 。 但 是 任何 方法 的 接收 者 是 指针 的 情况 下 ， 应 该 避免 复制 T 的 实例 ， 因 为 这 么 做 可 能 
会 破坏 内 部 原本 的 数据 。 比 如 ， 复 制 bytes.Buffer 实例 只 会 得 到 相当 于 原来 bytes 数组 的 一 
个 别名 ( 见 2.3.2 节 )。 随 后 的 方法 调用 会 产生 不 可 预期 的 结果 。 


nil 是 一 个 合法 的 接收 者 

就 像 一 些 函 数 允 许 nil 指针 作为 实 参 ， 方 法 的 接收 者 也 一 样 ， 尤 其 是 当 nil 是 类 型 中 有 
意义 的 零 值 (如 map 和 slice 类 型 ) 时 ， 更 是 如 此 。 在 这 个 简单 的 整 型 数 链表 中 ，nil 代表 空 
链表 : 

// IntList 是 整 型 链表 

// *IntList 的 类 型 nil 代 表 空 列表 

type IntList struct { 

Value int 


Tail *IntList 
} 


// Sum 返 回 列表 元 素 的 总 和 
func (list *IntList) Sum() int { 
if list == nil { 
return 6 


} 


return list.Value + list.Tail.Sum() 


} 
当 定 义 一 个 类 型 允许 nil 作为 接收 者 时 ， 应 当 在 文档 注释 中 显 式 地 标明 ， 如 上 面 的 例子 
所 示 。 
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这 是 net/url 包 中 values 类 型 的 部 分 定义 : 


net/url 
package url : 
// Values 映射 字符 串 到 字符 串 列表 
type Values map[string][]string 
// Get 返回 第 一 个 具有 给 定 key 的 值 
// 如 不 存在 ， 则 返回 空 字符 串 
func (v Values) Get(key string) string { 
if vs := v[key]; len(vs) > 8 { 
return vs[6] 


} 


return "" 

} 

// Add 添加 一 个 键 值 到 对 应 key 列表 中 . 

func (v Values) Add(key, value string) { 
v[key] = append(v[key], value) 

} 


它 的 实现 是 map 类 型 但 也 提供 了 一 系列 方法 来 简化 map 的 操作 ， 它 的 值 是 字符 串 
slice， 即 一 个 多 重 map。 使 用 者 可 以 使 用 它 固 有 的 操作 方式 (make、slice 字面 量 、m[key]， 
等 方式 ),， 或 者 使 用 它 的 方法 ,或 同时 使 用 : 


gopl.io/ch6/urlvalues 


m := url.Values{"lang": {"en"}} // 直接 构造 
m.Add("item", "1") 
m.Add("item", "2") 


fmt.Println(m.Get("lang")) // "en" 
fmt.Println(m.Get("q")) RY 





fmt.Println(m.Get("item")) // "1" (第 一 个 值 ) 
fmt.Println(m["item"]) // "[1 2]” (直接 访问 map) 
m = nil 

fmt.Println(m.Get("item")) //"" 
m.Add("item", "3") // 宕 机 : 赋值 给 空 的 map 类 型 


在 最 后 一 个 et 调用 中 ，nil 接收 者 充当 一 个 空 map。 它 可 以 等 同 地 写成 values(nil)， 
Get("item")， 但 是 nil.6Get("item") 不 能 通过 编译 ， 因 为 nil 的 类 型 没有 确定 。 相 比 之 下 ， 最 
后 的 Add 方法 会 发 生 宕 机 因为 它 尝试 更 新 一 个 空 的 map。 

因为 url.values 是 map 类 型 而 且 map 间接 地 指向 它 的 键 / 值 对 ， 所 以 url.values.Add 
对 map 中 元 素 的 任何 更 新 和 删除 操作 对 调用 者 都 是 可 见 的 。 然 而 ， 和 普通 函数 一 样 ， 方 法 
对 引用 本 身 做 的 任何 改变 ， 比 如 设置 url.values 为 nil 或 者 使 它 指向 一 个 不 同 的 map 数据 结 
构 ， 都 不 会 在 调用 者 身上 产生 作用 。 


6.3 ”通过 结构 体内 骨 组 成 类 型 
考虑 coloredPoint 类 型 : 


gopl.io/ch6/coloredpoint 





import "image/color" 


type Point struct{ X, Y float64 } 


法 125 





type ColoredPoint struct { 
Point 
Color color.RGBA 
} 
我 们 只 是 想 定义 一 个 有 三 个 字段 的 结构 体 coloredPoint， 但 实际 上 我 们 内 嵌 了 一 个 point 
类 型 以 提供 字段 x 和 Y。 在 4.4.3 节 已 经 看 到 ， 内 笛 使 我 们 更 简便 地 定义 了 coloredpoint 类 
型 ， 它 包含 Point 类 型 的 所 有 字段 以 及 其 他 更 多 的 自 有 字段 。 如 果 需 要 ， 可 以 直接 使 用 
ColoredPoint 内 所 有 的 字段 而 不 需要 提 到 point 类 型 ， 





var cp ColoredPoint 

cp.X = 1 
fmt.Println(cp.Point.X) // "1" 
cep.Point.Y = 2 
fmt.Println(cp.Y) // "2" 


同 理 ， 这 也 适用 于 Point 类 型 的 方法 。 我 们 能 够 通过 类 型 为 coloredpoint 的 接收 者 调用 
内 榜 类 型 Point 的 方法 ， 即 使 在 coloredpoint 类 型 没有 声明 过 这 个 方法 的 情况 下 : 


red := color.RGBA{255, 6, 06, 255} 

blue := color.RGBA{0, 80, 255, 255} 

var p = ColoredPoint{Point{1, 1}, red} 
var q = ColoredPoint{Point{5, 4}, blue} 
fmt.Println(p.Distance(q.Point)) // "5" 
p.ScaleBy(2) 

q.ScaleBy(2) 
fmt.Println(p.Distance(q.Point)) // "16" 


Point 的 方法 都 被 纳入 到 coloredPoint 类 型 中 。 以 这 种 方式 ， 内 符 允 许 构成 复杂 的 类 型 ， 
该 类 型 由 许多 字段 构成 ， 每 个 字段 提供 一 些 方法 。 

熟悉 基于 类 的 面向 对 象 编程 语言 的 读者 可 能 认为 point 类 型 就 是 coloredpoint 类 型 的 基 
类 ， 而 coloredPoint 则 作为 子 类 或 派生 类 ， 或 将 这 两 个 之 间 的 关系 翻译 为 coloredpoint 就 是 
Point 的 其 中 一 种 表现 。 但 这 是 个 误解 。 注 意 上 面 调用 pistance 的 地 方 。Distance 有 一 个 形 
参 Point，9 不 是 Point， 因此 虽然 9 有 一 个 内 瞪 的 Point 字段 ,但 是 必须 显 式 地 使 用 它 。 尝 
试 直接 传递 q 作为 参数 会 报错 : 


p.Distance(q) // 编译 错误 : 不 能 将 q (ColoredPoint) 转换 为 Point 类 型 


ColoredPoint 并 不 是 point， 但 是 它 包含 一 个 point， 并 且 它 有 两 个 另 外 的 方法 Distance 
和 ScaleBy 来 自 point。 如 果 考 虑 具体 实现 ， 实 际 上 ， 内 符 的 字段 会 告诉 编译 器 生成 额外 的 包 
装 方法 来 调用 point 声明 的 方法 ， 这 相当 于 以 下 代码 : 


func (p ColoredPoint) Distance(q Point) float64 { 
return p.Point.Distance(q) 


func (p *ColoredPoint) ScaleBy(factor float64) { 
p.Point.ScaleBy(factor) 
} 
当 Point.Distance 在 上 面 的 第 一 个 包 调 方法 内 调用 的 时 候 ， 接 收 者 的 值 是 p.Point 而 不 
是 p， 而 且 这 个 方法 是 不 能 访问 coloredpoint (其 中 内 向 了 Point) 类 型 的 。 
匿名 字段 类 型 可 以 是 个 指向 命名 类 型 的 指针 ， 这 个 时 候 ， 字 段 和 方法 间接 地 来 自 于 所 指 
向 的 对 象 。 这 可 以 让 我 们 共享 通用 的 结构 以 及 使 对 象 之 间 的 关系 更 加 动态 、 多 样 化 。 下 面 的 
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Coloredpoint 声明 内 般 了 *Point: 


type ColoredPoint struct { 
*point 
Color color.RGBA 

} 


p := ColoredpPoint{&Point{1, 1}, red} 
q := Coloredpoint{&Point{5, 4}, blue} 
fmt.Println(p.Distance(*q.Point)) // "5" 


q.Point = p.Point // p 和 q 共享 同一 个 Point 
p.ScaleBy(2) 
fmt.Println(*p.Point, *q.Point) // "{2 2} {2 2}" 


结构 体 类 型 可 以 拥有 多 个 匿名 字段 。 声 明 coloredPoint: 


type ColoredPoint struct { 
Point 
color .RGBA 

} 


那么 这 个 类 型 的 值 可 以 拥有 Point 所 有 的 方法 和 RGBA 所 有 的 方法 ， 以 及 任何 其 他 直接 在 
ColoredPoint 类 型 中 声明 的 方法 。 当 编译 器 处 理 选择 子 ( 比 如 p.scaleBy) 的 时 候 ， 首 先 ， 它 
先 查 找到 直接 声明 的 方法 scaleBy， 之 后 再 从 来 自 coloredPoint 的 内 骨 字 段 的 方法 中 进行 查 
找 ， 再 之 后 从 Point 和 RGBA 中 内 骨 字 段 的 方法 中 进行 查找 ， 以 此 类 推 。 当 同一 个 查找 级 别 中 
有 同名 方法 时 ， 编 译 器 会 报告 选择 子 不 明确 的 错误 。 

方法 只 能 在 命名 的 类 型 (比如 Point) 和 指向 它们 的 指针 ( *Point) 中 声明 ， 但 内 骸 帮 助 
我 们 能 够 在 未 命名 的 结构 体 类 型 中 声明 方法 。 

下 面 是 个 很 好 的 示例 。 这 个 例子 展示 了 简单 的 缓存 实现 ， 其 中 使 用 了 两 个 包 级 别 的 变 
量 一 一 互 斥 锁 (9.2 节 ) 和 map， 互 斥 锁 将 会 保护 map 的 数据 。 


var ( 
mu sync.Mutex // 保护 mapping 
mapping = make(map[string]string) 


) 


func Lookup(key string) string { 
mu.Lock() 
v := mapping[key] 
mu.Unlock() 
return v 


} 


下 面 这 个 版 本 的 功能 和 上 面 完 全 相同 ,但 是 将 两 个 相关 变量 放 到 了 一 个 包 级 别 的 变量 
cache 中 : 


var cache = struct { 
sync.Mutex 
mapping map[string]string 
} 1 


mapping: make(map[string]string), 


func Lookup(key string) string { 
cache.Lock() 
Vv := cache.mapping[key] 
cache.Unlock() 
return v 
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新 的 变量 名 更 加 贴切 ， 而 且 sync.Mutex 是 内 嵌 的 ， 它 的 Lock 和 Unlock 方法 也 包含 进 了 
结构 体 中 ， 人 允许 我 们 直接 使 用 cache 变量 本 身 进行 加 锁 。 


6.4 方法 变量 与 表达 式 

通常 我 们 都 在 相同 的 表达 式 里 使 用 和 调用 方法 ， 就 像 在 p.pistance() 中 , 但 是 把 两 个 
操作 分 开 也 是 可 以 的 。 选 择 子 p.Distance 可 以 赋予 一 个 方法 变量 ， 它 是 一 个 函数 ， 把 方法 
( Point.Distance) 绑 定 到 一 个 接收 者 p 上 。 函 数 只 需要 提供 实 参 而 不 需要 提供 接收 者 就 能 够 
调用 。 

p := Point{1, 2} 

q := Point{4, 6} 


distanceFromP := p.Distance // 方法 变量 
fmt.Println(distanceFromP(q)) 7“ 号 
var origin Point // {0, 8} 


fmt.Println(distanceFromP(origin)) // "2.236866797749979", V5 
scaleP := p.ScaleBy // 方法 变量 


scaleP(2) // p 变 成 (2，4) 
scaleP(3) // 然后 是 (6，12) 
scaleP(16) // 然后 是 (66，126) 


如 果 包 内 的 API 调用 一 个 函数 值 ， 并 且 使 用 者 期 望 这 个 函数 的 行为 是 调用 一 个 特定 接收 
者 的 方法 ,方法 变量 就 非常 有 用 。 比 如 ， 气 数 time.AfterFunc 会 在 指定 的 延迟 后 调用 一 个 函 
数值 。 这 个 程序 使 用 time.AfterFunc 在 10s 后 启动 火箭 r; 


type Rocket struct { /* ... */ } 
func (r *Rocket) Launch() { /* ... */ } 


r := new(Rocket) 
time.AfterFunc(16 * time.Second, func() { r.Launch() }) 


如 果 使 用 方法 变量 则 可 以 更 简洁 : 

time.AfterFunc(16 * time.Second, r.Launch) 

与 方法 变量 相关 的 是 方法 表达 式 。 和 调用 一 个 普通 的 函数 不 同 ， 在 调用 方法 的 时 候 必 须 
提供 接收 者 ， 并 且 按 照 选择 子 的 语法 进行 调用 。 而 方法 表达 式 写 成 T.f 或 者 (*T).f， 其 中 T 
是 类 型 ， 是 一 种 函数 变量 ， 把 原来 方法 的 接收 者 替换 成 函数 的 第 一 个 形 参 ， 因 此 它 可 以 像 平 
常 的 函数 一 样 调用 。 


p := Point{1, 2} 
q := Point{4, 6} 


distance := Point.Distance  // 方法 表达 式 
fmt.Println(distance(p, q)) // "5" 
fmt.Printf("%T\n", distance) // "func(Point, Point) float64" 


scale := (*Point).ScaleBy 

scale(&p, 2) 

fmt.Println(p) // "{2 4}" 

fmt.Printf("%T\n", scale) // "func(*Point, float64)" 

如 果 你 需要 用 一 个 值 来 代表 多 个 方法 中 的 一 个 ， 而 方法 都 属于 同一 个 类 型 ， 方 法 变量 可 
以 帮助 你 调用 这 个 值 所 对 应 的 方法 来 处 理 不 同 的 接收 者 。 在 下 面 这 个 例子 中 ， 变 量 op 代表 
加 法 或 减法 ， 二 者 都 属于 Point 类 型 的 方法 。Path.TranslateBy 调用 了 它 计算 路 径 上 的 每 一 
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type Point struct{ X，Y float64 } 


func (p Point) Add(q Point) Point { return Point{p.X + 
func (p Point) Sub(q Point) Point { return Point{p.X - 


EE<] 


type Path []Point 


func (path Path) TranslateBy(offset Point, add bool) { 
var op func(p，q Point) Point 

if add 

op 

} else 

op 


En 


Point.Add 


Le 


Point.Sub 

} 

for i := range path { 
// 调用 path[i].Add(offset) 或 者 是 path[i].Sub(offset) 
path[i] = op(path[i], offset) 


. 


6.5 示例 : 位 向 量 


Go 语言 的 集合 通常 使 用 map[T]bool 来 实现 ， 其 中 了 是 元 素 类 型 。 使 用 map 的 集合 扩展 
性 良好 ,但 是 对 于 一 些 特定 问题 ， 一 个 专门 设计 过 的 集合 性 能 会 更 优 。 比 如 ， 在 数据 流 分 析 
领域 ， 集 合 元 素 都 是 小 的 非 负 整 型 ， 集 合 拥有 许多 元 素 ， 而 且 集 合 的 操作 多 数 是 求 并 集 和 交 
集 ， 位 向 量 是 个 理想 的 数据 结构 。 

位 向 量 使 用 一 个 无 符号 整 型 值 的 slice， 每 一 位 代表 集合 中 的 一 个 元 素 。 如 果 设 置 第 i 位 
的 元 素 ， 则 认为 集合 包含 i。 下 面 的 程序 演示 了 一 个 含有 三 个 方法 的 简单 位 向 量 类 型 。 


gopl.io/ch6/intset 
// IntSet 是 一 个 包含 非 负 整 数 的 集合 
// 零 值 代表 空 的 集合 
type IntSet struct { 
words [J]uint64 


// Has 方 法 的 返回 值 表示 是 否 存 在 非 负数 xX 
func (s *IntSet) Has(x int) bool { 
word, bit := x/64, uint(x%64) 
return word < len(s.words) && s.words[word]&(1<<bit) != 6 


} 


// Add 添 加 非 负数 x 到 集合 中 
func (s *IntSet) Add(x int) { 
word, bit := x/64, uint(x%64) 
for word >= len(s.words) { 
s.words = append(s.words, 8) 


s.words[word] |= 1 << bit 


上 


// UnionWith 将 会 对 s 和 t 做 并 集 并 将 结果 存在 S 中 
func (s *IntSet) UnionWith(t *IntSet) { 
for i, tword := range t.words { 
if i < len(s.words) { 
s.words[i] |= tword 
} else { 
s.words = append(s.words, tword) 


} 
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由 于 每 一 个 字 拥 有 64 位 ， 因 此 为 了 定位 x 位 的 位 置 ， 我们 使 用 商 数 x/64 作为 字 的 索 
引 ， 而 x%64 记 作 该 字 内 位 的 索引 。unionwith 操作 使 用 按 位 “或 ”操作 符 | 来 计算 一 次 64 个 
元 素 求 并 集 的 结果 。( 在 练习 6.5 中 会 再 来 看 64 位 字 的 选择 。) 

这 个 实现 缺少 许多 需要 的 特性 ， 有 些 会 在 练习 中 列 出 来 ， 但 是 有 一 个 特性 不 得 不 在 这 里 
提 到 : 以 字符 串 输出 Intset 的 方法 。 添 加 一 个 String 方法 ， 就 像 在 2.5 节 里 的 celsius 类 型 
那样 。 


// String 方 法 以 字符 串 "{1 2 3}" 的 形式 返回 集中 
func (s *IntSet) String() string { 

var buf bytes.Buffer 

buf .WriteByte('{') 


for i, word := range s.words { 
if word == 6 { 
continue 
} 


for j := 0; j < 64; j++ { 
if word&(1<<uint(j)) != @ { 
if buf.Len() > len("{") { 
buf.WriteByte(' ') 


} 
fmt.Fprintf(&buf, "%d", 64*i+j) 
} 
} 
} 
buf.WriteByte('}') 
return buf.String() 
} 
注意 ， 上 面 的 String 方法 和 3.5.4 节 的 intsTostring 相似 ; 在 String 方法 中 bytes.Buffer 
经 常 以 这 样 的 方式 用 到 。fmt 包 把 具有 string 方法 的 类 型 进行 特殊 处 理 ， 于 是 ， 即 使 是 复杂 
类 型 也 可 以 按照 友好 的 方式 显示 出 来 。fmt 默认 调用 string 方法 而 不 是 原生 的 值 。 这 个 机 制 
需要 依靠 接口 和 类 型 断言 ， 第 7 章 将 介绍 它们 。 
现在 ， 可 以 演示 Intset 了 : 


var x, y IntSet 

x.Add(1) 

x.Add(144) 

x.Add(9) 

fmt.Println(x.String()) // "{1 9 144}" 
y.Add(9) 

y.Add(42) 

fmt.Println(y.String()) // "{9 42}" 
x.UnionWith(&y) 

fmt.Println(x.String()) // "{1 9 42 144}" 


fmt.Println(x.Has(9), x.Has(123)) // "true false" 

提醒 一 句 : 我 们 为 指针 类 型 *Tntset 声明 了 string 和 Has 方法 并 非 出 于 需要， 而 是 为 了 
和 其 他 两 个 方法 保持 一 致 ， 另 外 两 个 方法 需要 指针 接收 者 ， 因 为 它们 需要 对 s.words 进行 由 
值 。 所 以 ，Intset 的 值 并 不 含有 string 方法 ,使 用 它 可 能 会 产生 意料 外 的 结果 : 


fmt.Println(&x) // "{1 9 42 144}" 
fmt.Println(x.String()) // "{1 9 42 144}" 
fmt.Println(x) // "{[4398646511618 8 65536]}" 


第 一 个 示例 中 ， 输 出 了 *Intset 指针 ， 它 有 一 个 string 方 法 。 第 二 个 示例 中 ， 基 于 
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Intset 值 调用 string() ; 编译 器 会 帮 有 我 们 隐 式 地 插入 & 操 作 符 ， 我 们 得 到 指针 后 就 可 以 获 
取 到 string 方法 了 。 但 在 第 三 个 示例 中 ， 因 为 Intset 值 本 身 并 没有 string 方法 ， 所 以 fmt. 
Println 直接 输出 结构 体 。 因 此 ， 记 得 加 上 & 操作 符 很 重要 。 那 么 给 Intset (而 不 是 *Intset ) 
加 上 string 方法 应 该 是 个 不 错 的 主意 ， 但 这 还 是 需要 根据 实际 情况 来 看 。 

练习 6.1: 实现 这 些 附加 的 方法 : 


func (*IntSset) Len() int // 返回 元 素 个 数 
func (*IntSet) Remove(x int) // 从 集合 去 除 元 素 x 
func (*IntSet) Clear() // 删除 所 有 元 素 


func (*IntSet) Copy() *IntSet // 返回 集合 的 副本 

练习 6.2: 定义 一 个 变 长 方法 (*Intset).AddAl1(…int)， 它 允许 接受 一 串 整 型 值 作为 参 
数 ， 比 如 s.AddAl1(1,2,3)。 

练习 6.3: (*Intset).unionwith 计算 了 两 个 集合 的 并 集 ， 使 用 | 操作 符 对 每 个 字 进 行 按 
位 “或 ”操作 。 实 现 交 集 、 差 集 和 对 称 差 运算 。( 两 个 集合 的 对 称 差 包含 只 在 某 个 集合 中 存 
在 的 元 素 。) 

练习 6.4: 添加 方法 Elems 返回 包含 集合 元 素 的 slice， 这 适合 在 range 循环 中 使 用 。 

练习 6.5: IntSet 使 用 的 每 个 字 的 类 型 都 是 uint64， 但 是 64 位 的 计算 在 32 位 平台 上 的 
效率 不 高 。 改 写 程序 以 使 用 uint 类 型 ， 这 是 适应 平台 的 无 符号 整 型 。 除 以 64 的 操作 可 以 使 
用 一 个 常量 来 代表 32 位 或 64 位 。 你 或 许可 以 使 用 一 个 讨 巧 的 表达 式 32<<(^uint(e)>>63) 来 
表示 除数 。 


6.6 封装 

如 果 变 量 或 者 方法 是 不 能 通过 对 象 访问 到 的 ， 这 称 作 封装 的 变量 或 者 方法 。 封 装 (有 时 
候 称 作 数据 隐藏 ) 是 面向 对 象 编 程 中 重要 的 一 方面 。 

Go 语言 只 有 一 种 方式 控制 命名 的 可 见 性 : 定义 的 时 候 ， 首 字母 大 写 的 标识 符 是 可 以 从 
包 中 导出 的 ， 而 首 字 母 没 有 大 写 的 则 不 导出 。 同样 的 机 制 也 同样 作用 于 结构 体内 的 字段 和 类 
型 中 的 方法 。 结 论 就 是 ， 要 封装 一 个 对 象 ， 必 须 使 用 结构 体 。 

这 就 是 为 什么 上 一 节 里 Intset 类 型 被 声明 为 结构 体 但 是 它 只 有 单个 字段 : 

type IntSet struct { 

words []uint64 

} 

可 以 重新 定义 Intset 为 一 个 slice 类 型 ， 如 下 所 示 ， 当 然 ， 必 须 把 方法 中 出 现 的 s.words 
替换 为 *s。 


type IntSet []uint64 


尽管 这 个 版 本 的 Intset 和 之 前 的 基本 等 同 ， 但 是 它 将 能 够 允许 其 他 包 内 的 使 用 方 读 取 
和 改变 这 个 slice。 换 句 话 说， 表达 式 *s 可 以 在 其 他 包 内 使 用 ，s.words 只 能 在 定义 Intset 的 
包 内 使 用 。 

另 一 个 结论 就 是 在 Go 语言 中 封装 的 单元 是 包 而 不 是 类 型 。 无 论 是 在 函数 内 的 代码 还 是 
方法 内 的 代码 ， 结 构 体 类 型 内 的 字段 对 于 同一 个 包 中 的 所 有 代码 都 是 可 见 的 。 

封装 提供 了 三 个 优点 。 第 一 ， 因 为 使 用 方 不 能 直接 修改 对 象 的 变量 ， 所 以 不 需要 更 多 的 
语句 用 来 检查 变量 的 值 。 








第 二 ， 隐 藏 实现 细节 可 以 防止 使 用 方 依 赖 的 属性 发 生 改 变 ， 使 得 设计 者 可 以 更 加 灵活 地 
改变 API 的 实现 而 不 破坏 兼容 性 。 

作为 一 个 例子 ， 考 虑 bytes.Buffer 类 型 。 它 用 来 堆积 非常 小 的 字符 串 ， 因 此 为 了 优化 性 
能 ， 实 现 上 会 预 留 一 部 分 额外 的 空间 避免 频繁 申请 内 存 。 由 于 Buffer 是 结构 体 类 型 ， 因 此 
这 块 空间 使 用 额外 的 一 个 字段 [64]byte， 且 命名 不 是 首 字 母 大 写 。 因 为 这 个 字段 没有 导出 ， 
bytes 包 之 外 的 Buffer 使 用 者 除了 能 感觉 到 性 能 的 提升 之 外 ， 不 会 关心 其 中 的 实现 。Buffer 
和 它 的 Grow 方法 如 下 面 的 例子 所 示 : 


type Buffer struct { 
buf []byte 
initial [64]byte 
A a 
// Grow 方法 按 需 扩展 缓冲 区 的 大 小 
// 保证 n 个 字 节 的 空间 
func (b *Buffer) Grow(n int) { 
if b.buf == nil { 
b.buf = b.initial[:6] // 最 初 使 用 预 分 配 的 空间 


} 

if len(b.buf)+n > cap(b.buf) { 
buf := make([Jbyte, b.Len(), 2*cap(b.buf) + n) 
copy(buf, b.buf) 
b.buf = buf 


} 
} 


第 三 个 重要 的 好 处 ， 就 是 防止 使 用 者 肆意 地 改变 对 象 内 的 变量 。 因 为 对 象 的 变量 只 能 被 
同一 个 包 内 的 函数 修改 ， 所 以 包 的 作者 能 够 保证 所 有 的 函数 都 可 以 维护 对 象 内 部 的 资源 。 比 
如 ， 下 面 的 counter 类 型 允许 使 用 者 递增 计数 或 者 重 置 计数 器 ， 但 是 不 能 够 随意 地 设置 当前 
计数 器 的 值 : 


type Counter struct { n int } 


func (c *Counter) N() int { return c.n } 
func (c *Counter) Increment() { c.n++ } 
func (c *Counter) Reset() {cns=0 } 


仅仅 用 来 获得 或 者 修改 内 部 变量 的 函数 称 为 getter 和 setter， 就 像 log 包 里 的 Logger 类 
型 。 然 而 ， 命 名 getter 方法 的 时 候 ， 通 常 将 Get 前 缀 省 略 。 这 个 简洁 的 命名 习惯 也 同样 适用 
在 其 他 宛 余 的 前 缀 上 ， 比 如 Fetch 、Find 和 Lookup。 


package log 


type Logger struct { 
flags int 
prefix string 
Ve 


func (1 *Logger) Flags() int 

func (1 *Logger) SetFlags(flag int) 

func (1 *Logger) Prefix() string 

func (1 *Logger) Setprefix(prefix string) 


Go 语言 也 允许 导出 的 字段 。 当 然 , 一旦 导出 就 必须 要 面 对 API 的 兼容 问题 ， 因 此 最 初 
的 决定 需要 慎重 ， 要 考虑 到 之 后 维护 的 复杂 程度 ， 将 来 发 生变 化 的 可 能 性 ， 以 及 变化 对 原本 
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代码 质量 的 影响 等 。 
封装 并 不 总 是 必需 的 。time.Duration 对 外 暴露 int64 的 整 型 数 用 于 获得 微 秒 ， 这 使 我 们 
能 够 对 其 进行 通常 的 数学 运算 和 比较 操作 ， 甚 至 定义 常数 : 


const day = 24 * time.Hour 
fmt.Println(day.Seconds()) // "86480" 


另 一 个 例子 可 以 比较 Intset 和 本 章 开 头 的 geometry.Path 类 型 。Path 定义 为 一 个 slice 类 
型 ， 人 允许 它 的 使 用 者 使 用 slice 字面 量 的 语法 来 构成 实例 ， 比 如 使 用 range 循环 遍历 Path 所 
有 的 点 等 ， 而 Intset 则 不 允许 这 些 操 作 。 

有 个 明显 的 对 比 : geometry.Path 从 本 质 上 讲 就 只 是 连续 的 点 ， 以 后 也 不 会 添加 新 的 字 
段 ， 因 此 geometry 包 将 Path 的 slice 类 型 暴露 出 来 是 合理 的 做 法 。 与 它 不 同 的 是 ，Intset 只 
是 看 上 去 像 [juint64 的 slice。 但 它 实际 上 完全 可 以 是 [Juint 或 其 他 复杂 的 集合 类 型 ， 而 且 
另外 用 来 记录 集合 中 元 素数 量 的 字段 充当 了 重要 的 作用 。 基 于 上 述 原 因 ，Intset 不 对 外 透明 
也 合情合理 。 

在 这 一 章 中 ， 我 们 学 习 了 如 何在 命名 类 型 中 定义 方法 ， 以 及 如 何 调用 它们 。 尽 管 方法 是 
面向 对 象 编程 的 关键 ， 但 这 一 章 只 讲述 了 其 中 的 一 部 分 内 容 。 下 一 章 会 继续 介绍 接口 相关 的 
内 容 来 完成 这 方面 的 学 习 。 
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接口 类 型 是 对 其 他 类 型 行为 的 概括 与 抽象 。 通 过 使 用 接口 ， 我 们 可 以 写 出 更 加 灵活 和 通 
用 的 函数 ， 这 些 函 数 不 用 绑 定 在 一 个 特定 的 类 型 实现 上 。 

很 多 面向 对 象 的 语言 都 有 接口 这 个 概念 ，Go 语言 的 接口 的 独特 之 处 在 于 它 是 隐 式 实现 。 
换 句 话说 ， 对 于 一 个 具体 的 类 型 ， 无 须 声明 它 实现 了 哪些 接口 ， 只 要 提供 接口 所 必需 的 方法 
即 可 。 这 种 设计 让 你 无 须 改变 已 有 类 型 的 实现 ， 就 可 以 为 这 些 类 型 创建 新 的 接口 ， 对 于 那些 
不 能 修改 包 的 类 型 ， 这 一 点 特别 有 用 。 

本 音 首 先 会 介绍 接口 类 型 的 基本 机 制 类 型 价值 。 然 后 会 讨论 标准 库 中 的 几 种 重要 接口 。 
因为 在 很 多 Go 程序 中 ， 相 对 于 新 创建 的 接口 ， 标 准 库 中 的 接口 使 用 得 并 不 少 。 最 后 ， 我 们 
还 要 了 解 一 下 类 型 断言 ( 见 7.10 节 ) 以 及 类 型 分 支 ( 见 7.13 节 )， 以 及 它们 如 何 实现 另 一 种 
类 型 的 通用 化 。 


7.1 接口 即 约定 


之 前 介绍 的 类 型 都 是 具体 类 型 。 具 体 类 型 指定 了 它 所 含 数据 的 精确 布局 ， 还 暴露 了 基于 
这 个 精确 布局 的 内 部 操作 。 比 如 对 于 数值 有 算术 操作 ， 对 于 slice 类 型 我 们 有 索引 、append、 
range 等 操作 。 具 体 类 型 还 会 通过 其 方法 来 提供 额外 的 能 力 。 总 之 ， 如 果 你 知道 了 一 个 具体 
类 型 的 数据 ， 那 么 你 就 精确 地 知道 了 它 是 什么 以 及 它 能 干什么 。 

Go 语言 中 还 有 另外 一 种 类 型 称 为 接口 类 型 。 接 口 是 一 种 抽象 类 型 ， 它 并 没有 暴露 所 含 
数据 的 布局 或 者 内 部 结构 ， 当 然 也 没有 那些 数据 的 基本 操作 ， 它 所 提供 的 仅仅 是 一 些 方法 而 
已 。 如 果 你 拿 到 一 个 接口 类 型 的 值 ， 你 无 从 知道 它 是 什么 ， 你 能 知道 的 仅仅 是 它 能 做 什么 ， 
或 者 更 精确 地 讲 ， 仅 仅 是 它 提 供 了 哪些 方法 。 

本 书 通 篇 使 用 两 个 类 似 的 函数 实现 字符 串 的 格式 化 : fmt.pPrintf 和 fmt.sprintf。 前 者 把 
结果 发 到 标准 输出 〈 标 准 输出 其 实 是 一 个 文件 )， 后 者 把 结果 以 string 类 型 返回 。 格 式 化 是 
两 个 函数 中 最 复杂 的 部 分 ， 如 果 仅 仅 因为 两 个 函数 在 输出 方式 上 的 轻微 差异 ， 就 需要 把 格式 
化 部 分 在 两 个 函数 中 重复 一 遍 ， 那 么 就 太 糟糕 了 。 幸 运 的 是 ， 通 过 接口 机 制 可 以 解决 这 个 问 
题 。 其 实 ， 两 个 函数 都 封装 了 第 三 个 函数 fmt.Fprintf， 而 这 个 函数 对 结果 实际 输出 到 哪里 
毫 不 关心 : 

package fmt 

func Fprintf(w io.Writer, format string, args ...interface{}) (int，error) 


func Printf(format string, args ...interface{}) (int, error) { 
return Fprintf(os.Stdout, format, args...) 


func Sprintf(format string, args ...interface{}) string { 
var buf bytes.Buffer 
Fprintf(&buf, format, args...) 
return buf.String() 

} 
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Fpringf 的 前 缀 上 指 文件 ， 表 示 格 式 化 的 输出 会 写 人 第 一 个 实 参 所 指 代 的 文件 。 对 于 
printf， 第 一 个 实 参 就 是 os.stdout， 它 属于 *os.File 类 型 。 对 于 sprintf， 尽 管 第 一 个 实 参 
不 是 文件 ， 但 它 模拟 了 一 个 文件 : &buf 就 是 一 个 指向 内 存 缓冲 区 的 指针 ， 与 文件 类 似 ， 这 个 
缓冲 区 也 可 以 写 人 多 个 字 节 。 

其 实 Fprintf 的 第 一 个 形 参 也 不 是 文件 类 型 ， 而 是 io.writer 接口 类 型 ， 其 声明 如 下 : 

package io 


// Writer 接口 封装 了 基础 的 写 入 方法 

type Writer interface { 
// Write 从 p 向 底层 数据 流 写 入 len(p) 个 字 节 的 数据 
// 返回 实际 写 入 的 字 节 数 (8 <= n <= len(p)) 
// 如 果 没 有 写 完 ， 那 么 会 返回 遇 到 的 错误 
// 在 Write 返回 n < len(p) 时 ，err 必须 为 非 nil 
// Write 不 允许 修改 p 的 数据 ， 即 使 是 临时 修改 


// 

// 实现 时 不 允许 残留 p 的 引用 

Write(p []byte) (n int, err error) 
} 


io.writer 接口 定义 了 Fprintf 和 调用 者 之 间 的 约定 。 一 方面 ， 这 个 约定 要 求 调用 者 提供 
的 具体 类 型 (比如 *os.File 或 者 *bytes.Buffer) 包含 一 个 与 其 签名 和 行为 一 致 的 write 方法 。 
另 一 方面 ， 这 个 约定 保证 了 Fprintf 能 使 用 任何 满足 io.writer 接口 的 参数 。Fprintf 只 需要 
能 调用 参数 的 write 函数 ， 无 须 假 设 它 写 人 的 是 一 个 文件 还 是 一 段 内 存 。 

因为 fmt.Fprintf 仅 依 赖 于 io.writer 接口 所 约定 的 方法 ， 对 参数 的 具体 类 型 没有 要 求 ， 
所 以 我 们 可 以 用 任何 满足 io.writer 接口 的 具体 类 型 作为 fmt.Fprintf 的 第 一 个 实 参 。 这 种 可 
以 把 一 种 类 型 替换 为 满足 同一 接口 的 另 一 种 类 型 的 特性 称 为 可 取代 性 ( substitutability)， 这 
也 是 面向 对 象 语言 的 典型 特征 。 

让 我 们 创建 一 个 新 类 型 来 测试 这 个 特性 。 如 下 所 示 的 *Bytecounter 类 型 的 write 方法 仅 
仅 统 计 传人 数据 的 字 节 数 ， 然 后 就 不 管 那些 数据 了 。( 下 面 的 代码 中 出 现 的 类 型 转换 是 为 了 
让 len(p) 和 *c 满足 += 操作 。) 


Bopl1.io/ch7/bytecounter 





type ByteCounter int 


func (c *ByteCounter) Write(p []byte) (int, error) { 
*C += ByteCounter(len(p)) // 转换 int 为 ByteCounter 类 型 
return len(p), nil 


} 
因为 *Bytecounter 满足 io.writer 接口 的 约定 ， 所 以 可 以 在 Fprintf 中 使 用 它 ，Fprintf 
察觉 不 到 这 种 类 型 差异 ，Bytecounter 也 能 正确 地 累积 格式 化 后 结果 的 长 度 。 


var c ByteCounter 
c.Write([]byte("hello")) 
fmt.Println(c) // "5", = len("hello") 


Cc = 8 // 重 置 计数 器 

var name = "Dolly" 

fmt.Fprintf(&c, "hello, %s", name) 
fmt.Println(c) // "12", = len("hello, Dolly") 


除 之 io.writer 之 外 ，fmt 包 还 有 另 一 个 重要 的 接口 。Fprintf 和 Fprintln 提供 了 一 个 让 
类 型 控制 如 何 输出 自己 的 机 制 。 在 2.5 节 中 ， 给 celsius 类 型 定义 了 一 个 string 方法 ， 这 样 
可 以 输出 "lee " 这 样 的 结果 。 在 6.5 节 中 ， 也 给 *Intset 类 型 加 了 一 个 string 方法 ， 这 样 可 
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以 输出 类 似 "{1 2 3}" 的 传统 集合 表示 形式 。 定 义 一 个 string 方法 就 可 以 让 类 型 满足 这 个 广 
泛 使 用 的 接口 fmt.stringer， 
package fmt 


// 在 字符 串 格式 化 时 如 果 需 要 一 个 字符 串 
// 那么 就 调用 这 个 方法 来 把 当前 值 转化 为 字符 串 
// Print 这 种 不 带 格式 化 参数 的 输出 方式 也 是 调用 这 个 方法 
type Stringer interface { 
String() string 
} 


7.10 节 会 解释 fmt 包 如 何 发 现 哪些 值 满足 这 个 接口 。 

练习 7.1 : 使 用 类 似 Bytecounter 的 想法 ， 实 现 单词 和 行 的 计数 器 。 实 现时 考虑 使 用 
bufio.ScanWords, 

练习 7.2 : 实现 一 个 满足 如 下 签名 的 countingwriter 函数 ， 输 入 一 个 io.writer， 输 出 一 
个 封装 了 输入 值 的 新 writer， 以 及 一 个 指向 int64 的 指针 ， 该 指针 对 应 的 值 是 新 的 writer 写 
人 的 字 节 数 。 


func CountingWriter(w io.Writer) (io.Writer, *int64) 


练习 7.3 : 为 gopl.io/ch4/treesort 中 的 *tree 类 型 ( 见 4.4 节 ) 写 一 个 string 方法， 用 
于 展示 其 中 的 值 序列 。 


7.2 接口 类 型 


一 个 接口 类 型 定义 了 一 套 方法 ， 如 果 一 个 具体 类 型 要 实现 该 接口 ， 那 么 必须 实现 接口 类 
型 定义 中 的 所 有 方法 。 

io.Writer 是 一 个 广泛 使 用 的 接口 ， 它 负责 所 有 可 以 写 入 字 节 的 类 型 的 抽象 ， 包 括 文件 、 
内 存 缓冲 区 、 网 络 连 接 、HTTP 客户 端 、 打 包 器 (archiver)、 散 列 器 (hasher) 等 。io 包 还 定 
义 了 很 多 有 用 的 接口 。Reader 就 抽象 了 所 有 可 以 读 取 字 节 的 类 型 ，closer 抽象 了 所 有 可 以 关 
闭 的 类 型 ， 比 如 文件 或 者 网 络 连接 。( 现 在 你 大 概 已 经 注意 到 Go 语言 的 单方 法 接口 的 命名 约 
定 了 。) 

package io 


type Reader interface { 
Read(p []byte) (n int, err error) 


type Closer interface { 
Close() error 


男 外 ,我们 还 可 以 发 现 通过 组 合 已 有 接口 得 到 的 新 接口 ， 比 如 下 面 两 个 例子 : 


type ReadWriter interface { 
Reader 
Writer 


} 


type ReadWriteCloser interface { 
Reader 
Writer 
Closer 


} 
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如 上 的 语法 称 为 嵌入 式 接 口 ， 与 嵌入 式 结构 类 似 ， 让 我 们 可 以 直接 使 用 一 个 接口 ， 而 不 
用 逐一 写 出 这 个 接口 所 包含 的 方法 。 如 下 所 示 ， 尽 管 不 够 简洁 ， 但 是 可 以 不 用 舱 人 式 来 声明 


io.ReadwWriter : 


type Readwriter interface { 
Read(p []byte) (n int，err error) 
Write(p []byte) (n int，err error) 
} 


也 可 以 混合 使 用 两 种 方式 : 


type ReadWriter interface { 
Read(p []byte) (n int, err error) 


Writer 
} 
三 种 声明 的 效果 都 是 一 致 的 。 方 法 定义 的 顺序 也 是 无 意义 的 ， 真正 有 意义 的 只 有 接口 的 
方法 集合 。 


练习 7.4: strings.NewReader 函数 输入 一 个 字符 串 ， 返 回 一 个 从 字符 串 读 取 数 据 且 满足 
io.Reader 接口 (也 满足 其 他 接口 ) 的 值 。 请 自己 实现 该 函数 ， 并 且 通 过 它 来 让 HTML 分 析 
器 (参考 5.2 节 ) 支持 以 字符 串 作 为 输入 。 

练习 7.5: io 包 中 的 LimitReader 函数 接受 io.Reader r 和 字 节 数 n， 返 回 一 个 Reader ， 该 
返回 值 从 r 读 取 数据 ， 但 在 读 取 n 字 节 后 报告 文件 结束 。 请 实现 该 函数 。 


func LimitReader(r io.Reader, n int64) io.Reader 


7.3 ”实现 接口 


如 果 一 个 类 型 实现 了 一 个 接口 要 求 的 所 有 方法 ， 那 么 这 个 类 型 实现 了 这 个 接口 。 比 如 
*os.File 类 型 实现 了 io.Reader、Writer、Closer 和 Readerwriter 接口 。*bytes.Buffer 实现 了 
Reader 、Writer 和 Readerwriter ， 但 没有 实现 closer ， 因 为 它 没 有 close 方法 。 为 了 简化 表述 ， 
Go 程序 员 通 常 说 一 个 具体 类 型 “是 一 个 ”(is-a) 特定 的 接口 类 型 ， 这 其 实 代表 着 该 具体 类 型 
实现 了 该 接口 。 比 如 ，*bytes.Buffer 是 一 个 io.Writer; *os.File 是 一 个 io.Readerwriter。 

接口 的 赋值 规则 (参考 2.4.2 节 ) 很 简单 ， 仅 当 一 个 表达 式 实 现 了 一 个 接口 时 ， 这 个 表 
达 式 才 可 以 赋 给 该 接口 。 所 以 : 


var w io.Writer 


w = 0s.Stdout // OK: *os.File 有 Write 方法 
WwW = new(bytes.Buffer)  // OK: *bytes.Buffer 有 Write 方法 
Ww = time.Second // 编译 错误 : time.Duration 缺 少 Nrite 方 法 


var rwc io.ReadWriteCloser 
rwc = os.Stdout // OK: *os.File 有 Read、Write、Close 方 法 
rwc = new(bytes.Buffer) // 编译 错误 : *bytes.Buffer 缺 少 Close 方 法 


当 右 侧 表达 式 也 是 一 个 接口 时 ， 该 规则 也 有 效 : 


W = rwc // OK: io.ReadWriteCloser 有 Write 方法 
rwc = WwW // 编译 错误 : io.Writer 缺少 Close 方 法 


因为 Readwriter 和 Readwritercloser 接口 包含 了 writer 的 所 有 方法 ， 所 以 任何 实现 了 
Readwriter 或 ReadwriterCloser 类 型 的 方法 都 必然 实现 了 writer。 
在 进一步 讨论 之 前 ， 我 们 先 解释 一 下 一 个 类 型 有 某 一 个 方法 的 具体 含义 。6.2 节 曾 提 到 ， 
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对 每 一 个 具体 类 型 T， 部 分 方法 的 接收 者 就 是 T， 而 其 他 方法 的 接收 者 则 是 *T 指针 。 同 时 我 
们 对 类 型 T 的 变量 直接 调用 *T 的 方法 也 可 以 是 合法 的 ， 只 要 改变 量 是 可 变 的 ， 编 译 器 隐 式 
地 帮 你 完成 了 取 地 址 的 操作 。 但 这 仅仅 是 一 个 语法 糖 ， 类 型 T 的 方法 没有 对 应 的 指针 *T 多 ， 
所 以 实现 的 接口 也 可 能 比 对 应 的 指针 少 。 

比如 ，6.5 节 提 到 的 Intset 类 型 的 String 方法 ， 需 要 一 个 指针 接收 者 ， 所 以 我 们 无 法 从 
一 个 无 地 址 的 Intset 值 上 调用 该 方法 : 


type IntSet struct { /* 。。*/ } 
func (*IntSet) String() string 


var _ = IntSet{}.String() // 编译 错误 : String 方法 需要 *IntSet 接收 者 
但 可 以 从 一 个 Intset 变量 上 调用 该 方法 : 


var s IntSet 
var _ = Ss.String() // OK: s 是 一 个 变量 ，&s 有 String 方法 


因为 只 有 *Intset 有 String 方法， 所 以 也 只 有 *Intset 实现 了 fmt.stringer 接口 : 


var _ fmt.Stringer = &s // OK 
var _ fmt.Stringer = s // 编译 错误 : IntSet 缺 少 String 方法 


在 12.8 节 ， 有 一 个 程序 可 以 输出 一 个 任意 值 的 方法 ，godoc-annalysis=type 工具 ( 见 
10.7.4 节 ) 也 可 以 显示 每 个 类 型 的 方法 ， 以 及 接口 和 具体 类 型 的 关系 。 

正如 信封 封装 了 信件 ， 接 口 也 封装 了 所 对 应 的 类 型 和 数据 ， 只 有 通过 接口 暴露 的 方法 才 
可 以 调用 ， 类 型 的 其 他 方法 则 无 法 通过 接口 来 调用 : 


os.Stdout .Write([]byte("hello")) // OK: *os.File 有 Write 方法 
os.Stdout.Close() // OK: *os.File 有 Close 方法 


var w io.Writer 

Ww = os.Stdout 

w.Write([]byte("hello")) // OK: io.Writer 有 Write 方法 
w.Close() // 编译 错误 : io.Writer 缺少 Close 方法 


一 个 拥有 更 多 方法 的 接口 ， 比 如 io.Readwriter， 与 io.Reader 相 比 ， 给 了 我 们 它 所 指向 
数据 的 更 多 信息 ， 当 然 也 给 实现 这 个 接口 提出 更 高 的 门槛 。 那 么 对 于 接口 类 型 interface{}， 
它 完全 不 包含 任何 方法 ,通过 这 个 接口 能 得 到 对 应 具体 类 型 的 什么 信息 呢 ? 

确实 什么 信息 也 得 不 到 。 看 起 来 这 个 接口 没有 任何 用 途 ， 但 实际 上 称 为 空 接口 类 型 的 
interface{} 是 不 可 缺少 的 。 正 因为 空 接口 类 型 对 其 实现 类 型 没有 任何 要 求 ， 所 以 我 们 可 以 
把 任何 值 赋 给 空 接 口 类 型 。 


var any interface{} 


any = true 
any = 12.34 
any = "hello" 


any = map[string]int{"one": 1} 
any = new(bytes .Buffer) 


其 实在 本 书 的 第 一 个 示例 中 就 用 了 空 接口 类 型 ， 靠 它 才 可 以 让 fmt.Println、errorf ( 参 
考 5.7 节 ) 这 类 的 函数 能 够 接受 任意 类 型 的 参数 。 

当然 ， 即 使 我 们 创建 了 一 个 指向 布尔 值 、 浮 点 数 、 字 符 串 、map、 指 针 或 者 其 他 类 型 的 
interfacef} 接口 ， 也 无 法 直接 使 用 其 中 的 值 ， 毕 竟 这 个 接口 不 包含 任何 方法 。 我 们 需要 一 
个 方法 从 空 接口 中 还 原 出 实际 值 ， 在 7.10 节 中 我 们 可 以 看 到 如 何 用 类 型 断言 来 实现 该 功能 。 

判定 是 否 实现 接口 只 需要 比较 具体 类 型 和 接口 类 型 的 方法 ， 所 以 没有 必要 在 具体 类 型 的 
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定义 中 声明 这 种 关系 。 也 就 是 说 ， 偶 尔 在 注释 中 标注 也 不 坏 ， 但 对 于 程序 来 讲 ， 这 种 关系 声 
明 不 是 必需 的 。 如 下 声明 在 编译 器 就 断言 了 *byte.Buffer 类 型 的 一 个 值 必然 实现 了 io.writer: 


// *bytes.Buffer 必须 实现 io.Writer 
var w io.Writer = new(bytes.Buffer) 


我 们 甚至 不 需要 创建 一 个 新 的 变量 ， 因 为 *bytes.Buffer 的 任意 值 都 实现 了 这 个 接口 ， 
甚至 nil， 在 我 们 用 (*bytes.Buffer)(nil) 来 强制 类 型 转换 后 ， 也 实现 了 这 个 接口 。 当 然 ， 既 
然 我 们 不 想 引 用 w， 那 么 我 们 可 以 把 它 替 换 为 空白 标识 符 。 基 于 这 两 点 ， 修 改 后 的 代码 可 以 
节省 不 少 变量 : 

// *bytes.Buffer 必须 实现 io.Writer 

var _ io.Writer = (*bytes.Buffer)(nil) 

非 空 的 接口 类 型 (比如 io.writer) 通常 由 一 个 指针 类 型 来 实现 ， 特 别 是 当 接口 类 型 的 一 
个 或 多 个 方法 上 暗示 会 修改 接收 者 的 情形 (比如 write 方法)。 一 个 指向 结构 的 指针 才 是 最 常见 
的 方法 接收 者 。 

指针 类 型 肯定 不 是 实现 接口 的 唯一 类 型 ， 即 使 是 那些 包含 了 会 改变 接收 者 方法 的 接口 类 
型 ， 也 可 以 由 Go 的 其 他 引用 类 型 来 实现 。 我 们 已 经 见 过 slice 类 型 的 方法 ( geometry.Path， 
参考 6.1 节 )， 以 及 map 类 型 的 方法 ( url.values， 参 考 6.2.1 节 )， 稍 后 我 们 还 可 以 看 到 函数 
类 型 的 方法 (http.HandlerFunc， 参 考 7.7 节 )。 基 础 类 型 也 可 以 实现 方法 ， 比 如 我 们 会 在 7.4 
节 见 到 的 time.Duration 类 型 实现 了 fmt.Sstringer。 

一 个 具体 类 型 可 以 实现 很 多 不 相关 的 接口 。 比 如 一 个 程序 管理 或 者 销售 数字 文化 商品 ， 
比如 音乐 、 电 影 和 图 书 。 那 么 它 可 能 定义 了 如 下 具体 类 型 : 


Album 
Book 
Movie 
Magazine 
Podcast 
TVEpisode 
Track 


我 们 可 以 把 感 兴趣 的 每 一 种 抽象 都 用 一 种 接口 类 型 来 表示 。 一 些 属性 是 所 有 商品 都 具备 
的 ， 比 如 标题 、 创 建 日 期 以 及 创建 者 列表 (作者 或 者 艺术 家 )。 


type Artifact interface { 
Title() string 
Creators() []string 
Created() time.Time 


其 他 属性 则 局 限于 特定 类 型 的 商品 。 比 如 字数 这 个 属性 只 与 书 和 杂志 相关 ， 而 屏幕 分 辨 
率 则 只 与 电影 和 电视 剧 相关 。 


type Text interface { 
Pages() int 
Words() int 
PageSize() :int 


type Audio interface { 
Stream() (io.ReadCloser, error) 
RunningTime() time.Duration 
Format() string // 比如 "MP3"、"WAV" 


type Video interface { 
Stream() (io.ReadCloser，error) 
RunningTime() time.Duration 
Format() string // 比如 "MP4"、"WMV" 
Resolution() (x, y int) 

下 


这 些 接口 只 是 一 种 把 具体 类 型 分 组 并 暴露 它们 共性 的 方式 ， 未 来 我 们 也 可 以 发 现 其 他 
的 分 组 方式 。 比 如 ， 如 果 我 们 要 把 Audio 和 video 按照 同样 的 方式 来 处 理 ， 就 可 以 定义 一 个 
Streamer 接口 来 呈现 它们 的 共性 ， 而 不 用 修改 现 有 的 类 型 定义 。 


type Streamer interface { 
Stream() (io.ReadCloser, error) 
RunningTime() time.Duration 
Format() string 


从 具体 类 型 出 发 、 提 取 其 共性 而 得 出 的 每 一 种 分 组 方式 都 可 以 表示 为 一 种 接口 类 型 。 与 
基于 类 的 语言 (它们 显 式 地 声明 了 一 个 类 型 实现 的 所 有 接口 ) 不 同 的 是 ， 在 Go 语言 里 我 们 
可 以 在 需要 时 才 定 义 新 的 抽象 和 分 组 ， 并 且 不 用 修改 原 有 类 型 的 定义 。 当 需要 使 用 另 一 个 作 
者 写 的 包 里 的 具体 类 型 时 ， 这 一 点 特别 有 用 。 当 然 ， 还 需要 这 些 具体 类 型 在 底层 是 真正 有 共 
性 的 。 


7.4 ”使 用 flag.Value 来 解析 参数 


在 本 节 中 ， 我们 将 看 到 如 何 使 用 另外 一 个 标准 接口 flag.value 来 帮助 我 们 定义 命令 行 标 
志 。 考 虑 如 下 一 个 程序 ， 它 实现 了 睡眠 指定 时 间 的 功能 。 


gop1.io/ch7/sleep 
var period = flag.Duration("period", 1*time.Second, "sleep period") 


func main() { 
flag.Parse() 
fmt.Printf("Sleeping for %v...", *period) 
time.Sleep(*period) 
fmt.Println() 
} 


在 程序 进入 睡眠 前 输出 了 睡眠 时 长 。fmt 包 调用 了 time.Duration 的 string 方法 ， 可 以 按 
照 一 个 用 户 友好 的 方式 来 输出 ， 而 不 是 输出 一 个 以 纳 秒 为 单位 的 数字 。 


$ go build gopl.io/ch7/sleep 
$ ./sleep 
Sleeping for 1s... 


默认 的 睡眠 时 间 是 1s， 但 可 以 用 -period 命令 行 标志 来 控制 。flag.Duration 函数 创建 了 
一 个 time.Duration 类 型 的 标志 变量 ， 并 且 人 允许 用 户 用 一 种 友好 的 方式 来 指定 时 长 ， 比 如 可 
以 用 string 方法 对 应 的 记录 方法 。 这 种 对 称 的 设计 提供 了 一 个 良好 的 用 户 接口 。 


$ ./sleep -period 56ms 

Sleeping for 56ms.. . 

$ ./sleep -period 2m36s 

Sleeping for 2m36s... 

$ ./sleep -period 1.5h 

Sleeping for 1h36m6s... 

$ ./sleep -period "1 day" 

invalid value "1 day" for flag -period: time: invalid duration 1 day 
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因为 时 间 长 度 类 的 命令 行 标志 广泛 应 用 ， 所 以 这 个 功能 内 置 到 了 flag 包 。 支 持 自 定义 
类 型 其 实 也 不 难 ， 只 须 定义 一 个 满足 flag.value 接口 的 类 型 ， 其 定义 如 下 所 示 : 


package flag 


// Value 接口 代表 了 存储 在 标志 内 的 值 
type Value :interface { 
String() string 
Set(string) error 
} 
string 方法 用 于 格式 化 标志 对 应 的 值 ， 可 用 于 输出 命令 行 帮助 消息 。 由 于 有 了 该 方法 ， 
因此 每 个 flag.value 其 实 也 是 fmt.stringer。set 方法 解析 了 传人 的 字符 串 参数 并 更 新 标志 
值 。 可 以 认为 set 方法 是 String 方法 的 闭 操 作 ， 两 个 方法 使 用 同样 的 记 法 规格 是 一 个 很 好 的 
下 面 定义 了 celsiusFlag 类 型 来 允许 在 参数 中 使 用 摄氏 温度 或 华氏 温度 。 注 意 ， 
celsiusFlag 内 机 了 一 个 celsius 类 型 (参考 2.5 节 )， 所 以 已 经 有 String 方法 了 。 为 了 满足 
flag.Value 接口 ， 只 须 再 定义 一 个 set 方法 : 
gopl.io/ch7/tempconv 


// *celsiusFlag 满足 flag.Value 接口 
type celsiusFlag struct{ Celsius } 


func (f *celsiusFlag) Set(s string) error { 
var unit string 
var value float64 
fmt.Sscanf(s，"%f%s"，&value，&unit) // 无 须 检 查 错误 
switch unit { 
case "C", "°C": 
f.Celsius = Celsius(value) 
return nil 
case "F", "°F": 
f.Celsius = FToC(Fahrenheit(value)) 
return nil 


return fmt.Errorf("invalid temperature %q", s) 


} 


fmt.Sscanf 困 数 用 于 从 输入 s 解析 一 个 浮 点 值 ( value) 和 一 个 字符 串 (unit)。 尽 管 通常 
都 必须 检查 sscanf 的 错误 结果 ， 但 在 这 种 情况 下 我 们 无 须 检查 。 因 为 如 果 出 现 错误 ， 那 么 
接 下 来 的 跳 转 条 件 没有 一 个 会 满足 。 

如 下 celsuisFlag 函数 封装 了 上 面 的 逻辑 。 这 个 函数 返回 了 一 个 celsius 指针 ， 它 指向 租 
入 在 celsuisFlag 变量 f 中 的 一 个 字段 。celsuis 字段 在 标志 处 理 过 程 中 会 发 生变 化 (经 由 set 
方法 )。 调 用 var 方法 可 ee 命令 行 标记 集合 中 ， 即 全 局 变量 flag. 
commandLine。 如 果 一 个 程序 有 非常 复杂 的 命令 行 接口 ， 那 么 单个 全 局 变量 flag.CommandLine 
就 不 够 用 了 ， Ra 调用 var 方法 时 会 把 *celsuisFlag 实 参 赋 
给 flag.value 形 参 ， 编 译 器 会 在 此 时 检查 *celsuisFlag 类 型 是 否 有 flag.Value 所 必需 的 
方法 。 

// CelsiusFlag 根据 给 定 的 name、 默 认 值 和 使 用 方法 


// 定义 了 一 个 Celsius 标 志 ， 返回 了 标志 值 的 指针 
// 标志 必须 包含 一 个 数值 和 一 个 单位 ， 比 如 : "188C" 
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func CelsiusFlag(name string, value Celsius, usage string) *Celsius { 
f := celsiusFlag{value} 
flag.CommandLine.Var(&f, name, usage) 
return &f.Celsius 


} 
现在 可 以 在 程序 中 使 用 这 个 新 标志 


gopl.io/ch7/tempflag 
var temp = tempconv.CelsiusFlag("temp", 20.0, "the temperature") 


func main() { 
flag.Parse() 
fmt.Println(*temp) 
} 


接 下 来 是 一 些 典型 的 使 用 方法 : 


$ go build gopl.io/ch7/tempflag 
$ ./tempflag 
20°C 
$ ./tempflag -temp -18C 
-18°C 
$ ./tempflag -temp 212°F 
1686°C 
$ ./tempflag -temp 273.15K 
invalid value "273.15K" for flag -temp: invalid temperature "273.15K" 
Usage of ./tempflag: 
-temp value 
the temperature (default 28°C) 
$ ./tempflag -help 
Usage of ./tempflag: 
-temp value 
the temperature (default 28°C) 


练习 7.6: 在 tempflag 中 支持 热力 学 温度 。 
练习 7.7: 请 解释 为 什么 默认 值 20.6 没 写 *%c， 而 帮助 消息 中 却 包含 *c。 


7.5 接口 值 


从 概念 上 来 讲 ， 一 个 接口 类 型 的 值 (简称 接口 值 ) 其 实 有 两 个 部 分 : 一 个 具体 类 型 和 该 
类 型 的 一 个 值 。 二 者 称 为 接口 的 动态 类 型 和 动态 值 。 

对 于 像 Go 这 样 的 静态 类 型 语言 ， 类 型 仅仅 是 一 个 编译 时 的 概念 ， 所 以 类 型 不 是 一 个 
值 。 在 我 们 的 概念 模型 中 ， 用 类 型 描述 符 来 提供 每 个 类 型 的 具体 信息 ， 比 如 它 的 名 字 和 方 
法 。 对 于 一 个 接口 值 ， 类 型 部 分 就 用 对 应 的 类 型 描述 符 来 表述 。 

如 下 四 个 语句 中 ， 变 量 w 有 三 个 不 同 的 值 (最 初 和 最 后 是 同一 个 值 ): 


var w io.Writer 

WwW = Os.Stdout 

WwW = new(bytes.Buffer) 
W = nil 


接 下 来 让 我 们 详细 地 查看 一 下 在 每 个 语句 之 后 w 的 值 和 相关 的 动态 行为 。 第 一 个 语句 声 
明了 WwW: 


var w io.Writer 


在 Go 语言 中 ， 变 量 总 是 初始 化 为 一 个 特定 的 值 ， 接 口 也 不 例外 。 接 口 的 零 值 就 是 把 它 
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的 动态 类 型 和 值 都 设置 为 mil， 如 图 7-1 所 示 。 
一 个 接口 值 是 否 是 nil 取决 于 它 的 动态 类 型 ， 所 以 现在 这 是 一 个 nil 接口 值 。 可 以 用 w == 
nil 或 者 w! = nil 来 检测 一 个 接口 值 是 否 是 nil。 调 用 一 个 nil 接口 的 任何 方法 都 会 导致 月 溃 : 
w.Write([]byte("hello")) // 崩 演 : 对 空 指针 取 引 用 什 
第 二 个 语句 把 一 个 *os.File 类 型 的 值 赋 给 了 w: 


w = os.Stdout 

这 次 赋值 把 一 个 具体 类 型 隐 式 转换 为 一 个 接口 类 型 ， 它 与 对 应 的 显 式 转换 io.writer(os， 
stdout) 等 价 。 不 管 这 种 类 型 的 转换 是 隐 式 的 还 是 显 式 的 ， 它 都 可 以 转换 操作 数 的 类 型 和 
值 。 接 口 值 的 动态 类 型 会 设置 为 指针 类 型 *os.File 的 类 型 描述 符 ， 它 的 动态 值 会 设置 为 
os.stdout 的 副本 ， 即 一 个 指向 代表 进程 的 标准 输出 的 os.File 类 型 的 指针 ， 如 图 7-2 所 示 。 


W W 


值 | ni 和 | ”一 一 
图 7-1 一 个 nil 接口 值 图 7-2 包含 os.File 指针 的 接口 值 


调用 该 接口 值 的 write 方法 ， 会 实际 调用 (*os.File).write 方法 ， 即 输出 "hello"。 

w.Write([]byte("hello")) // "hello" 

一 般 来 讲 ， 在 编译 时 我 们 无 法 知道 一 个 接口 值 的 动态 类 型 会 是 什么 ， 所 以 通过 接口 来 做 
调用 必然 需要 使 用 动态 分 发 。 编 译 器 必须 生成 一 段 代码 来 从 类 型 描述 符 拿 到 名 为 write 的 方 
法 地 址 ， 再 间接 调用 该 方法 地 址 。 调 用 的 接收 者 就 是 接口 值 的 动态 值 ， 即 os.stdout， 所 以 
实际 效果 与 直接 调用 等 价 : 

os.Stdout.Write([]byte("hello")) // "hello" 

第 三 个 语句 把 一 个 *bytes.Buffer 类 型 的 值 赋 给 了 接口 值 : 

w = new(bytes.Buffer) 

动态 类 型 现在 是 *bytes.Buffer， 动态 值 现在 则 是 一 个 指向 新 分 配 缓冲 区 的 指针 ， 如 
图 7-3 所 示 。 


W 
:ee 
7-3 包含 *bytes .Buffer 指针 的 接口 值 
调用 write 方法 的 机 制 也 跟 第 二 个 语句 一 致 : 


w.Write([]byte("hello")) // 把 "hello" 写 入 bytes.Buffer 
、 这 次 ， 类 型 描述 符 是 *+bytes.Buffer， 所 以 调用 的 是 (*bytes.Buffer).write 方法 ， 方法 的 
接收 者 是 缓冲 区 的 地 址 。 调 用 该 方法 会 追加 "hello" 到 缓冲 区 。 
最 后 ， 第 四 个 语句 把 nil 赋 给 了 接口 值 : 


Ww = nil 





这 个 语句 把 动态 类 型 和 动态 值 都 设置 为 mil， 把 w 恢复 到 了 它 刚 声明 时 的 状态 (如 图 7-1 
所 示 )。 

一 个 接口 值 可 以 指向 多 个 任意 大 的 动态 值 。 比 如 ，time.Time 类 型 可 以 表示 一 个 时 刻 ， 
它 是 一 个 包含 儿 个 非 导出 字段 的 结构 。 如 果 从 它 创 建 一 个 接口 值 : 


var x interface{} = time.Now() 
类 型 time.Time 


结果 可 能 如 图 7-4 所 示 。 从 理论 上 来 讲 ,无 论 动态 值 有 多 值 || sec: 63567389742 
大 ， 它 永远 在 接口 值 内 部 (当然 这 只 是 一 个 理论 模型 ， 实 际 的 实 
现 是 很 不 同 的 )。 i 

接口 值 可 以 用 == 和 != 操作 符 来 做 比较 。 如 果 两 个 接口 值 都 i 
是 nil 或 者 二 者 的 动态 类 型 完全 一 致 旦 二 者 动态 值 相等 (使 用 动态 的 和 中 入 
类 型 的 == 操作 符 来 做 比较 )， 那 么 两 个 接口 值 相等 。 因 为 接口 值 
是 可 以 比较 的 ， 所 以 它们 可 以 作为 map 的 键 ， 也 可 以 作为 switch 语句 的 操作 数 。 

需要 注意 的 是 ， 在 比较 两 个 接口 值 时 ， 如 果 两 个 接口 值 的 动态 类 型 一 致 ， 但 对 应 的 动态 
值 是 不 可 比较 的 (比如 slice)， 那 么 这 个 比较 会 以 骨 溃 的 方式 失败 : 


var x interface{} = []int{f1，2，3} 
fmt.Println(x == Xx) // 宕 机 : 试图 比较 不 可 比较 的 类 型 []int 


从 这 点 来 看 ， 接 口 类 型 是 非 平凡 的 。 其 他 类 型 要 么 是 可 以 安全 比较 的 (比如 基础 类 型 和 
指针 )， 要 么 是 完全 不 可 比较 的 (比如 slice、map 和 函数 )， 但 当 比 较 接 口 值 或 者 其 中 包含 接 
口 值 的 聚合 类 型 时 ， 我 们 必须 小 心 崩 溃 的 可 能 性 。 当 把 接口 作为 map 的 键 或 者 switch 语句 
的 操作 数 时 ， 也 存在 类 似 的 风险 。 仅 在 能 确认 接口 值 包含 的 动态 值 可 以 比较 时 ， 才 比较 接 
口 值 。 

当 处 理 错 误 或 者 调试 时 ， 能 拿 到 接口 值 的 动态 类 型 是 很 有 帮助 的 。 可 以 使 用 fmt 包 的 抽 
来 实现 这 个 需求 : 


var WwW io.Writer 
fmt.Printf("%T\n", w) // "<nil>" 





Ww = Os.Stdout 
fmt.Printf("%T\n", w) // "*os.File" 


w = new(bytes .Buffer) 
fmt.Printf("%T\n", w) // "*bytes.Buffer" 


在 内 部 实现 中 ，fmt 用 反射 来 拿 到 接口 动态 类 型 的 名 字 。 第 12 章 将 进一步 讨论 反射 。 


注意 : 含有 空 指针 的 非 空 接口 


空 的 接口 值 (其 中 不 包含 任何 信息 ) 与 仅仅 动态 值 为 nil 的 接口 值 是 不 一 样 的 。 这 种 微 
妙 的 区 别 成 为 让 每 个 Go 程序 员 都 困惑 过 的 陷阱 。 

考虑 如 下 程序 ， 当 debug 设置 为 true 时 ， 主 函数 收集 函数 f 的 输出 到 一 个 缓冲 区 中 : 

const debug = true 


func main() { 
var buf *bytes.Buffer 
if debug { 
buf = new(bytes.Buffer) // 启用 输出 收集 
} 
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f(buf) // 注意 : 微妙 的 错误 
if debug { 
// ... 使 用 buf... 
} 
} 


// 如 果 out 不 是 nil， 那 么 会 向 其 写 入 输出 的 数据 
func f(out io.Writer) { 
1/ ss 其他 代码 ss 
if out != nil { 
out.Write([]Jbyte("done!\n")) 
} 
} 


当 设置 debug 为 false 时 ， 我 们 会 觉得 仅仅 是 不 再 收集 输出 ， 但 实际 上 会 导致 程序 在 调 
用 out .write 时 月 溃 : 


if out != nil { 
out .Write([]byte("donelNn")) // 宕 机 : 对 空 指 针 取 引 用 值 
} 


W 

当 main 函数 调用 f 时 ， 它 把 一 个 类 型 为 *bytes.Buffer 的 空 指针 类型 
赋 给 了 out 参数 ， 所 以 out 的 动态 值 确实 为 空 。 但 它 的 动态 类 型 是 。 “Ll 
*bytes.Buffer， 这 表示 out 是 一 个 包含 空 指针 的 非 空 接 口 ( 见 图 7-5 )， 图 7-5 包含 空 指 针 的 
所 以 防御 性 检查 out!= nil 仍然 是 true。 非 空 接口 

如 前 所 述 ， 动 态 分 发 机 制 决 定 了 我 们 肯定 会 调用 (*bytes.Buffer).write， 只 不 过 这 次 
接收 者 值 为 空 。 对 于 某 些 类 型 ， 比 如 *os.File， 空 接收 值 是 合法 的 (参考 6.2.1 节 ), 但 对 于 
*bytes.Buffer 则 不 行 。 方 法 尽管 被 调用 了 ， 但 在 尝试 访问 缓冲 区 时 朋 演 本。 

问题 在 于 ， 尽 管 一 个 空 的 *bytes.Buffer 指针 拥有 的 方法 满足 了 该 接口 ， 但 它 并 不 满足 
该 接口 所 需 的 一 些 行为 。 特 别 是 ， 这 个 调用 违背 了 (*bytes.Buffer) ,write 的 一 个 隐 式 的 前 置 
条 件 ， 即 接收 者 不 能 为 空 ， 所 以 把 空 指针 赋 给 这 个 接口 就 是 一 个 错误 。 解 决 方案 是 把 main “ 
函数 中 的 buf 类 型 修改 为 io.writer， 从 而 避免 在 最 开始 就 把 一 个 功能 不 完整 的 值 赋 给 一 个 
接口 。 

var buf io.Writer 


if debug { 
buf = new(bytes.Buffer) // 启用 输出 收集 


} 
f(buf) // OK 


既然 我 们 已 经 了 解 过 接口 值 的 机 制 ， 接 下 来 就 要 看 一 下 Go 标准 库 的 一 些 重要 接口 。 在 
接 下 来 的 三 节 中 ， 我 们 将 看 到 接口 在 排序 、Web 服务 、 错 误 处 理 中 的 应 用 。 


7.6 使 用 sort.Interface 来 排序 


与 字符 串 格式 化 类 似 ， 排 序 也 是 一 个 在 很 多 程序 中 广泛 使 用 的 操作 。 尽 管 一 个 最 小 的 快 
排 (Quicksort) 只 需 15 行 左 右 ， 但 一 个 健壮 的 实现 长 很 多 。 所 以 我 们 无 法 想象 在 每 次 需要 
时 都 重新 写 一 饥 或 者 复制 一 遍 。 

幸运 的 是 ，sort 包 提供 了 针对 任意 序列 根据 任意 排序 函数 原 地 排序 的 功能 。 这 样 的 设 
计 其 实 并 不 常见 。 在 很 多 语言 中 ， 排 序 算 法 跟 序 列 数据 类 型 绑 定 ， 排 序 算法 则 跟 序列 元 素 类 
型 绑 定 。 与 之 相反 的 是 ，Go 语言 的 sort.sort 函数 对 序列 和 其 中 元 素 的 布局 无 任何 要 求 ， 它 
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使 用 sort.Interface 接口 来 指定 通用 排序 算法 和 每 个 具体 的 序列 类 型 之 间 的 协议 ( contract)。 
这 个 接口 的 实现 确定 了 序列 的 具体 布局 (经常 是 一 个 slice)， 以 及 元 素 期 望 的 排序 方式 。 

一 个 原 地 排序 算法 需要 知道 三 个 信息 : 序列 长 度 、 比 较 两 个 元 素 的 含义 以 及 如 何 交换 两 
个 元 素 ， 所 以 sort.Interface 接口 就 有 三 个 方法 : 

package sort 


type Interface interface { 
Len() int 
Less(i, j int) bool // i，j 是 序列 元 素 的 下 标 
Swap(i, j int) 


要 对 序列 排序 ， 需 要 先 确定 一 个 实现 了 如 上 三 个 方法 的 类 型 ， 接 着 把 sort.sort 函数 应 
用 到 上 面 这 类 方法 的 实例 上 。 我 们 先 考 虑 几乎 是 最 简单 的 一 个 例子 : 字符 串 slice。 定 义 的 新 
类 型 stringslice 以 及 它 的 Len、Less、Swap 三 个 方法 如 下 所 示 : 


type StringSlice []string 

func (p StringSlice) Len() int { return len(p) } 

func (p StringSlice) Less(i, j int) bool { return p[i] < p[j] } 

func (p StringSlice) Swap(i, j int) { p[li], p[j] = p[j], p[li] } 

现在 就 可 以 对 一 个 字符 串 slice 进行 排序 ， 只 须 简单 地 把 一 个 slice 转换 为 stringslice 
类 型 即 可 ， 如 下 所 示 : 


sort.Sort(StringSlice(names)) 


类 型 转换 生成 了 一 个 新 的 slice， 与 原始 的 names 有 同样 的 长 度 、 容 量 和 底层 数组 ， 不 同 
的 就 是 额外 增加 了 三 个 用 于 排序 的 方法 。 

字符 串 slice 的 排序 太 常用 了 ， 所 以 sort 包 提 供 了 stringslice 类 型 ， 以 及 一 个 直接 排序 
的 strings 因数 ， 于 是 上 面 的 代码 可 以 简写 为 sort.Sstrings(names)。 

这 种 技术 可 以 方便 地 复 用 到 其 他 排序 方式 ， 比 如 ， 忽 略 大 小 写 或 者 特殊 字符 。( 本 书 的 
索引 词 和 页 码 排 序 也 用 了 这 个 技术 ， 只 是 加 了 额外 的 罗马 数字 逻辑 。) 对 于 更 复杂 的 排序 ， 
也 可 以 使 用 同样 的 思路 ， 只 用 加 上 更 复杂 的 数据 结构 和 更 复杂 的 sort.Interface 方法 实现 。 

这 里 的 排序 示例 将 是 一 个 以 表格 方式 显示 的 音乐 播放 列表 。 每 首 音乐 占 一 行 ， 每 个 字段 
都 是 这 首 音 乐 的 一 个 属性 ， 比 如 艺术 家 、 标 题 和 时 间 。 考 虑 使 用 图 形 用 户 界 面 来 展示 一 个 
表 ， 单 击 列 头 会 按 该 列 对 应 的 属性 来 进行 排序 ， 再 次 单 击 同一 个 列 头 会 逆序 排列 。 接 下 来 看 
一 下 如 何 响应 每 一 次 单 击 。 

如 下 变量 tracks 包含 一 个 播放 列表 。( 作 者 之 一 对 其 他 作者 的 音乐 品味 表示 遗憾 。) 每 个 元 
素 都 是 一 个 指向 Track 的 指针 。 尽 管 我 们 不 用 指针 ， 而 改 为 直接 存储 Tracks， 后 面 的 代码 也 能 
运行 ,考虑 到 sort 函数 要 交换 很 多 对 元 素 ， 所 以 在 元 素 是 一 个 指针 的 情况 下 代码 运行 速度 会 
更 快 ， 毕竟， 一 个 指针 的 大 小 只 有 一 个 字 长 ， 而 一 个 完整 的 Track 则 需要 8 个 甚至 更 多 的 字 。 

gop1.io/ch7/sorting 

type Track struct { 

Title string 
Artist string 
Album string 


Year int 
Length time.Duration 


志 
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var tracks = []*Track{ 
{"Go", "Delilah", "From the Roots Up"，2612， length("3m38s")}, 
{"Go", "Moby", "Moby", 1992, length("3m37s")}, 
{"Go Ahead", "Alicia Keys", "As I Am", 2007, length("4m36s")}, 
{"Ready 2 Go", "Martin Solveig", "Smash", 2811, length("4m24s")}, 
上 
func length(s string) time.Duration { 
d, err := time.ParseDuration(s) 
if err != nil { 
panic(s) 


return d 


} 


printTracks 函数 将 播放 列表 输出 为 一 个 表格 。 当 然 ， 一 个 图 形 界面 肯定 会 更 好 ， 但 
这 个 例 程 使 用 的 text/tabwriter 包 可 以 生成 一 个 如 下 所 示 的 干净 整洁 的 表格 。 注 意 ， 
*tabwriter.Writer 满足 io.writer 接口 ， 它 先 收集 所 有 写 人 的 数据 ， 在 Flush 方法 调用 时 才 格 
式 化 整个 表格 并 且 输 出 到 os.stdout。 


func printTracks(tracks []*Track) { 
const format = "%v\t%v\t%v\t%v\t%v\t\n" 
tw := new(tabwriter.Writer).Init(os.Stdout, 8, 8, 2, ' "，9) 
fmt.Fprintf(tw, format, "Title", "Artist", "Album", "Year", "Length") 
fmt.Fprintf(tw, format, "----- "”，"------ "”，"----- "”，"----"，"------ 
for ，t:= range tracks { 
fmt.Fprintf(tw, format, t.Title, t.Artist, t.Album, t.Year, t.Length) 


tw.Flush() // 计算 各 列 宽度 并 输出 表格 
上 


要 按照 Artist 字段 来 对 播放 列表 排序 ， 需 要 先 定义 一 个 新 的 slice 类 型 ， 以 及 必需 的 
Len、Less 和 Swap 方法 ， 正 如 Stringslice 一 样 。 


type byArtist []*Track 


func (x byArtist) Len() int { return len(x) } 
func (x byArtist) Less(i, j int) bool { return x[i].Artist < x[j].Artist } 
func (x byArtist) Swap(i, j int) { x[L] [了 二 XE 关 及 ] 让 


要 调用 通用 的 排序 例 称 ， 必 须 先 把 tracks 转换 为 定义 排序 规则 的 新 类 型 byArtist: 
sort.Sort(byArtist(tracks)) 


按照 艺术 家 排序 之 后 ， 从 printTracks 生成 的 输出 如 下 : 


Title Artist Album Year Length 
Go Ahead Alicia Keys As I Am 2667 4m36s 
Go Delilah From the Roots Up 2612 3m38s 
Ready 2 Go Martin Solveig Smash 2611 4m24s 
Go Moby Moby 1992 3m37s 


如 果 用 户 第 二 次 请 求 “ 按 照 艺术 家 排序 ”， 就 需要 把 这 些 音乐 反 向 排序 。 我 们 不 需要 
定义 一 个 新 的 byReverseArtist 类 型 和 对 应 的 反 向 Less 方法 ， 因 为 sort 包 已 经 提供 了 一 个 
Reverse 函数 ， 它 可 以 把 任意 的 排序 反 向 。 

按照 艺术 家 对 slice 反 向 排序 之 后 ， 从 printTracks 生成 的 输出 如 下 : 
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Title Artist Album Year Length 
Go Moby Moby 1992 3m37s 
Ready 2 Go Martin Solveig Smash 2611 4m24s 
Go Delilah From the Roots Up 2612 3m38s 
Go Ahead Alicia Keys As I Am 2667 4m36s 


sort .Reverse 立 数 值得 仔细 看 一 下 ， 因 为 它 使 用 了 一 个 重要 概念 : 组 合 (参考 6.3 节 )。 
sort 包 定 义 了 一 个 未 导出 的 类 型 reverse， 这 个 类 型 是 一 个 艇 人 了 sort.Interface 的 结构 。 
reverse 的 Less 方 法 直接 调用 了 内 髓 的 sort.Interface 值 的 Less 方 法 ， 但 只 交换 传人 的 下 
标 ， 就 可 以 颠倒 排序 的 结果 。 


package sort 
type reverse struct{ Interface } // that is，sort.Interface 
func (r reverse) Less(i, j int) bool { return r.Interface.Less(j, i) } 


func Reverse(data Interface) Interface { return reverse{data} } 


reverse 的 男 外 两 个 方法 Len 和 swap， 由 内 艇 的 sort.Interface 隐 式 提供 。 导 出 的 函数 
Reverse 则 返回 一 个 包含 原始 sort.Interface 值 的 reverse 实例 。 
如 果 要 按 其 他 列 来 排序 ， 就 需要 定义 一 个 新 的 类 型 ， 比 如 byvear: 


type byYear []*Track 


func (x byYear) Len() int { return len(x) } 
func (x byYear) Less(i, j int) bool { return x[i].Year < x[j].Year } 
func (x byYear) Swap(i, j int) { x[i3], x[j] = x[j], x[i] } 


把 tracks 按照 sort.sort(byYear(tracks)) 排序 后 ，printTracks 就 可 以 输出 一 个 按照 年 代 
排序 的 列表 了 : 


Title Artist Album Year Length 
Go Moby Moby 1992 3m37s 
Go Ahead Alicia Keys As I Am 2667 4m36s 
Ready 2 Go Martin Solveig Smash 2611 4m24s 
Go Delilah From the Roots Up 2612 3m38s 


对 于 每 一 类 slice 和 每 一 种 排序 函数 ， 都 需要 实现 一 个 新 的 sort.Interface。 如 你 所 见 ， 
Len 和 swap 方法 对 所 有 的 slice 类 型 都 是 一 样 的 。 在 下 一 个 例子 中 ， 具 体 类 型 customsort 组 合 
了 一 个 slice 和 一 个 函数 ， 让 我 们 只 写 一 个 比较 函数 就 可 以 定义 一 个 新 的 排序 。 顺 便 说 一 下 ， 
实现 sort.Interface 的 具体 类 型 并 不 一 定 都 是 slice， 比 如 customsort 就 是 一 个 结构 类 型 

type customSort struct { 


二 []*Track 
less func(x, y *Track) bool 


} 

func (x customSort) Len() int { return len(x.t) } 

func (x customSort) Less(i, j int) bool { return x.less(x.t[i], x.t[j]) } 
func (x customSort) Swap(i, j int) { tL]s .XE KEL] 


让 我 们 定义 个 一 个 多 层 的 比较 函数 ， 先 按照 标题 (Title) 排序 ， 接 着 是 年 份 Year， 最 后 
是 时 长 Length。 如 下 sort 调用 就 是 一 个 使 用 匿名 排序 函数 来 这 样 排 序 的 例子 : 
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sort.Sort(customSort{tracks, func(x, y *Track) bool { 
if x.Title != y.Title { 
return x.Title < y.Title 
} 
if x.Year != y.Year { 
return x.Year < y.Year 


} 
if x.Length != y.Length { 
return x.Length < y.Length 


return false 


}}) 

如 下 就 是 结果 。 注 意 ， 对 于 两 首 标题 都 是 “Go” 的 音乐 ， 年 份 较 早 的 排序 靠 前 : 
Title Artist Album Year Length 

Go Moby Moby 1992 3m37s 

Go Delilah From the Roots Up 2812 3m38s 

Go Ahead Alicia Keys As I Am 2667 4m36s 

Ready 2 Go Martin Solveig Smash 2611 4m24s 


对 一 个 长 度 为 n 的 序列 进行 排序 需要 O(n logn) 次 比较 操作 ， 而 判断 一 个 序列 是 否 已 经 
排 好 序 则 只 需 最 多 (n-1) 次 比较 。sort 包 提供 的 Issorted 函数 就 可 以 做 这 个 判断 。 与 sort. 
sort 类 似 ， 它 使 用 sort.Interface 来 抽象 序列 及 其 排序 函数 ， 只 是 从 不 调用 swap 方法 而 已 ， 
下 面 的 代码 就 演示 了 IntsAresorted、Ints 图 数 和 Intslice 类 型 

values := []int{3，1，4，1} 

fmt.Println(sort.IntsAreSorted(values)) // "false" 

sort.Ints(values) 

fmt.Println(values) “Iii34 

fmt.Println(sort.IntsAreSorted(values)) // "true" 

sort.Sort(sort.Reverse(sort.IntSlice(values))) 


fmt.Println(values) VA fd [ 林 汪 十 了] 
fmt.Println(sort.IntsAreSorted(values)) // "false" 


为 了 简便 起 见 ，sort 包 专 门 提供 了 对 于 []int、[]string、[]float64 自然 排序 的 函数 和 
相关 类 型 。 对 于 其 他 类 型 ， 比 如 []int64 或 者 [juint ， 则 需要 自己 写 ， 反 正 写 起 来 也 不 复杂 。 

练习 7.8 : 很 多 图 形 界面 提供 了 一 个 表格 控件 ， 它 支持 有 状态 的 多 层 排序 ， 先 按照 最 近 
单 击 的 列 来 排序 ， 接 着 是 上 一 次 单 击 的 列 ， 依 次 类 推 。 请 定义 sort.Interface 接口 实现 来 满 
足 如 上 需求 。 试 比较 这 个 方法 与 多 次 使 用 sort.stable 排序 的 异同 。 

练习 7.9 : 利用 html/template 包 ( 见 4.6 节 ) 来 蔡 换 printTracks 函数 ， 使 用 HTML 表 
格 来 显示 音乐 列表 。 结 合 上 一 个 练习 ， 来 实现 通过 单 击 列 头 来 发 送 HTTP 请 求 ， 进 而 对 表格 
排序 。 

练习 7.10 : sort.Interface 也 可 以 用 于 其 他 用 途 。 试 写 一 个 图 数 IsPalindrome(s sort. 
Interface)bool 来 判断 一 个 序列 是 否 是 回 文 ， 即 序列 反 转 后 是 否 保持 不 变 。 可 以 假定 对 于 下 
标 分 别 为 i、j 的 元 素 ， 如 果 !s.Less(i,j)&& !s.Less(j,i)， 那 么 两 个 元 素 相 等 。 


7.7 http.Handler 接口 


第 1 章 简单 介绍 了 如 何 用 net/http 包 来 实现 Web 客户 端 (参考 1.5 节 ) 和 服务 器 (参考 
1.7 节 )。 本 节 将 进一步 讨论 服务 端 API， 以 及 作为 其 基础 的 http.Handler 接口 。 
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net/http 
package http 


type Handler interface { 
ServeHTTP(w ResponseWriter, r *Request) 


} 


func ListenAndServe(address string, h Handler) error 


ListenAndserve 函数 需要 一 个 服务 器 地 址 ， 比 如 ”localhost:8668" ， 以 及 一 个 Handler 接 
口 的 实例 (用 来 接受 所 有 的 请 求 )。 这 个 函数 会 一 直 运 行 ， 直 到 服务 出 错 (或 者 启动 时 就 失 
败 了 ) 时 返回 一 个 非 空 的 错误 。 

设想 一 个 电子 商务 网 站 ,使 用 一 个 数据 库 来 存储 商品 和 价格 (以 美元 计价 ) 的 映射 。 如 下 
程序 将 展示 一 个 最 简单 的 实现 。 它 用 一 个 map 类 型 (命名 为 database) 来 代表 仓库 ， 再 加 上 一 
个 serveHTTP 方法 来 满足 http.Handler 接口 。 这 个 函数 遍历 整个 map 并 且 输 出 其 中 的 元 素 : 

gop1.io/ch7/http1 
func main() { 


db := database{"shoes": 50, "socks": 5} 
log.Fatal(http.ListenAndServe("localhost:8660", db)) 


type dollars float32 
func (d dollars) String() string { return fmt.Sprintf("$%.2f", d) } 
type database map[string]dollars 


func (db database) ServeHTTP(w http.ResponseWriter, req *http.Request) { 
for item, price := range db { 
fmt.Fprintf(w, "%s: %s\n", item, price) 
} 
} 


如 果 局 动 服务 器 : 


$ go build gopl.io/ch7/http1 
$ ./httpl & 


使 用 1.5 节 的 fetch 程序 来 连接 服务 器 (也 可 以 用 Web 浏览 器 )， 可 以 得 到 如 下 输出 : 


$ go build gopl.io/ch1/fetch 

$ ./fetch http://1ocalhost:8666 
shoes: $56.66 

socks: $5.66 


到 现在 为 止 ， 这 个 服务 器 只 能 列 出 所 有 的 商品 ， 而 且 是 完全 不 管 URL， 对 每 个 请 求 都 
是 如 此 。 一 个 更 加 真实 的 服务 器 会 定义 多 个 不 同 URL， 每 个 触发 不 同 的 行为 。 我 们 把 现 有 
功能 的 URL 设 为 /list， 再 加 上 另外 一 个 /price 用 来 显示 单个 商品 的 价格 ， 商 品 可 以 在 请 
求 参 数 中 指定 ， 比 如 /price?item=socks ， 


gopl1. io/ch7/http2 
func (db database) ServeHTTP(w http.ResponseWriter, req *http.Request) { 
switch req.URL.Path { 
case "/list": 
for item, price := range db { 
fmt.Fprintf(w, "%s: %s\n", item, price) 
} 
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case "/price": 
item := req.URL.Query().Get("item") 
price, ok := db[item] 
if lok { 
w.WriteHeader(http.StatusNotFound) // 464 
fmt.Fprintf(w, "no such item: %q\n", item) 
return 


fmt. Fprintf(w, "%s\n", price) 
default: 
w.WriteHeader(http.StatusNotFound) // 464 
fmt.Fprintf(w, "no such page: %s\n", req.URL) 
} 
} 


现在 ， 处 理 函 数 基于 URL 的 路 径 部 分 (req.URL.Path) 来 决定 执行 哪 部 分 逻辑 。 如 采 
处 理 函 数 不 能 识 Re 那么 它 通过 调用 w.writeHeader(http.statusNotFound) 来 返回 
一 个 HTTP 错误 。 注 意 ， 这 个 调用 必须 在 往 w 中 写 人 内 容 之 前 完成 (顺带 说 一 下 ，http， 
Responsewriter 也 是 一 个 接口 ， 它 扩充 了 io.writer， 加 了 发 送 HTTP 响应 头 的 方法 )。 也 可 
以 使 用 http.Error 这 个 工具 函数 来 达到 同样 目的 。 


msg := fmt.Sprintf("no such page: %s\n", req.URL) 
http.Error(w, msg, http.StatusNotFound) // 464 


对 于 /price 的 场景 ， 它 调用 了 URL 的 auery 方 法， 把 HTTP 的 请 求 参数 解析 为 一 个 
map， 或 者 更 精确 来 讲 ， 解 析 为 一 个 multimap， 由 net/url 包 的 url.values 类 型 ( 6.2.1 市 ) 
实现 。 它 找到 第 一 个 itenm 请 求 参数 ， 查 询 对 应 的 价格 。 如 果 商 品 没 找到 ， 则 返回 一 个 错误 

与 新 服务 端的 交互 范例 如 下 所 示 : 

$ go build gopl.io/ch7/http2 

$ go build gopl.io/ch1/fetch 

外 ./http2 & 

$ ./fetch http://1ocalhost:86686/1ist 

shoes: $56.66 

socks: $5.66 

$ ./fetch http://1ocalhost:8666/price?item=socks 

$5 .66 

$ ./fetch http://1ocalhost:8666/price?item=shoes 

$56.66 

$ ./fetch http://1Localhost:8666/price?item=hat 

no such item: "hat" 

$ ./fetch http://1ocalhost:8666/help 

no such page: /help 

显然 ， 可 以 继续 给 serveHTTP 方法 增加 功能 ， 但 对 于 一 个 真实 的 应 用 ， 应 当 把 每 部 分 逻 
辑 分 到 独立 的 函数 或 方法 。 进 一 步 来 讲 ， 某 些 相关 的 URL 可 能 需要 类 似 的 逻辑 ， 比 如 几 个 
图 片 文件 的 URL 可 能 都 是 /images/*.png 形式 。 因 为 这 些 原因 ，net/http 包 提供 了 一 个 请 求 
多 工 转 发 器 serveMux， 用 来 简化 URL 和 处 理 程序 之 间 的 关联 。 一 个 serveMux 把 多 个 http. 
Handler 组 合成 单个 http.Handler。 在 这 里 ， 我 们 再 次 看 到 满足 同一 个 接口 的 多 个 类 型 是 可 以 
互相 替代 的 ，Web 服务 器 可 以 把 请 求 分 发 到 任意 一 个 http.Handler， 而 不 用 管 后 面具 体 的 类 
型 是 什么 。 

对 于 一 个 更 复杂 的 应 用 ， 多 个 serveMux 会 组 合 起 来 ， 用 来 处 理 更 复杂 的 分 发 需求 。Go 
语言 并 没有 一 个 类 似 于 Ruby 的 Rails 或 者 Python 的 Django 那样 的 权威 Web 框架 。 这 并 不 
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是 说 那样 的 框架 无 法 存在 ， 只 是 Go 语言 的 标准 库 提供 的 基础 单元 足够 灵活 ， 以 至 于 那样 的 
框架 通常 不 是 必需 的 。 进 一 步 来 讲 ， 尽 管 框架 在 项 目 初期 带 来 很 多 便利 ,但 框架 带 来 了 额外 
复杂 性 ， 增 加 长 时 间 维 护 的 难度 。 

在 下 面 的 代码 中 ,创建 了 一 个 serveMux， 用 于 将 /list、/price 这 样 的 URL 和 对 应 的 
处 理 程序 关联 起 来 ,这些 处 理 程序 也 已 经 拆 分 到 不 同 的 方法 中 。 最 后 作为 主 处 理 程 序 在 
ListenAndserve 调用 中 使 用 这 个 serverMux: 

gopl1.io/ch7/http3 
func main() { 
db := database{"shoes": 50, "socks": 5} 
mux := http.NewServeMux() 
mux.Handle("/list", http.HandlerFunc(db.1ist)) 


mux.Handle("/price", http.HandlerFunc(db.price)) 
log.Fatal(http.ListenAndServe("localhost:86660", mux)) 


} 
type database map[string]dollars 


func (db database) list(w http.ResponseWriter, req *http.Request) { 
for item, price := range db { 
fmt.Fprintf(w, "%s: %s\n", item, price) 
} 
} 


func (db database) price(w http.ResponseWriter, req *http.Request) { 
item := req.URL.Query().Get("item") 
price, ok := db[item] 
if lok { 
w.WriteHeader(http.StatusNotFound) // 464 
fmt.Fprintf(w, "no such item: %q\n", item) 
return 


fmt.Fprintf(w, "%s\n", price) 
} 


我 们 先 关注 一 下 用 于 注册 处 理 程序 的 两 次 mux.Handle 调用 。 在 第 一 个 调用 中 ，db.1ist 
是 一 个 方法 值 (参考 6.4 节 )， 即 如 下 类 型 的 一 个 值 : 


func(w http.ResponseWriter, req *http.Request) 


当 调 用 db.1ist 时 ， 等 价 于 以 db 为 接收 者 调用 database.1ist 方 法。 所 以 db.list 是 一 
个 实现 了 处 理 功 能 的 函数 (而 不 是 一 个 实例 )， 因 为 它 没有 接口 所 需 的 方法 ， 所 以 它 不 满足 
http.Handler 接口 ， 也 不 能 直接 传 给 mux.Handle。 

表达 式 http.HandleFunc(db.list) 其 实 是 类 型 转换 ， 而 不 是 函数 调用 。 注 意 ，http. 
HandleFunc 是 一 个 类 型 。 它 有 如 下 定义 : 


net/http 
package http 


type HandlerFunc func(w ResponseWriter, r *Request) 


func (f HandlerFunc) ServeHTTP(w ResponseWriter, r *Request) { 
f(w, r) 
} 
HandlerFunc 演示 了 Go 语言 接口 机 制 的 一 些 不 常见 特性 。 它 不 仅 是 一 个 函数 类 型 ， 还 
拥有 自己 的 方法 ， 也 满足 接口 http.Handler。 它 的 serveHTTP 方法 就 调用 函数 本 身 ， 所 以 
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HandlerFunc 就 是 一 个 让 函数 值 满足 接口 的 一 个 适配器 ， 在 这 个 例子 中 ， 函 数 和 接口 的 唯一 
方法 拥有 同样 的 签名 。 这 个 小 技巧 让 database 类 型 可 以 用 不 同 的 方式 来 满足 http.Handler 接 
口 : 一 次 通过 list 方法 ,一 次 通过 price 方法 ， 依 次 类 推 。 

因为 这 种 注册 处 理 程序 的 方法 太 常 见 了 ， 所 以 serveMux 引入 了 一 个 HandleFunc 便捷 方法 
来 简化 调用 ， 处 理 程序 注册 部 分 的 代码 可 以 简化 为 如 下 形式 : 

gopl. io/ch7/http3a 

mux.HandleFunc("/list", db.1ist) 

mux.HandleFunc("/price", db.price) 

通过 上 面 的 代码 ， 我 们 可 以 看 到 构造 这 样 一 个 程序 也 是 简单 的 : 有 两 个 不 同 的 Web 服 
务 器 ， 在 不 同 的 端口 监听 ， 定 义 不 同 的 URL， 分 发 到 不 同 的 处 理 程 序 。 只 须 简 单 地 构造 另 
外 一 个 serveMux， 再 调用 一 次 ListenAndserve 即 可 (建议 并 发 调用 )。 但 对 于 绝 大 部 分 程序 来 
说 ,一 个 Web 服务 就 已 经 远 远足 够 了 。 另 外 ， 一 个 程序 可 能 在 很 多 文件 中 来 定义 HTTP 处 
理 程序 ， 如 果 每 次 都 需要 显 式 注 册 在 应 用 本 身 的 serverMux 实例 上 ， 那 就 太 麻 烦 了 。 

所 以 ， 为 简便 起 见 ，net/http 包 提 供 一 个 全 局 的 serveMux 实例 DefaultserveMux， 以 及 包 
级 别 的 注册 函数 http.Handle 和 http.HandleFunc。 要 让 DefaultserveMux 作为 服务 器 的 主 处 理 
程序 ， 无 须 把 它 传 给 ListenAndserve， 直 接 传 nil 即 可 。 

服务 器 的 主 函 数 可 以 进一步 简化 为 : 

gopl.io/ch7/http4 
func main() { 
db := database{"shoes": 50, "socks": 5} 
http.HandleFunc("/list", db.1ist) 


http.HandleFunc("/price", db.price) 
log.Fatal(http.ListenAndServe("localhost:8866", nil)) 


最 后 有 一 个 重要 的 提示 : 1.7 节 曾 提 到 ，Web 服务 器 每 次 都 用 一 个 新 的 goroutine 来 调用 
处 理 程序 ， 所 以 处 理 程序 必须 要 注意 并 发 问题 。 比 如 在 访问 变量 时 的 锁 问 题 ， 这 个 变量 可 能 
会 被 其 他 goroutine 访问 ， 包 括 由 同一 个 处 理 程序 处 理 的 其 他 请 求 。 接 下 来 的 两 章 会 继续 讨 
论 并 发 问题 。 

练习 7.11 : 增加 额外 的 处 理 程序 ， 来 支持 创建 、 读 取 、 更 新 和 删除 数据 库 条 目 。 比 如 ， 
/update?item=socks&price=6 这 样 的 请 求 将 更 新 仓库 中 物品 的 价格 ， 如 果 商 品 不 存在 或 者 价格 
无 效 就 返回 错误 。( 注 意 : 这 次 修改 会 引入 并 发 变量 修改 。) 

练习 7.12 : 修改 /list 的 处 理 程序 ， 改 为 输出 HTML 表格 ， 而 不 是 纯 文 本 。 可 以 考虑 
使 用 html/template 包 (参考 4.6 节 )。 


7.8 error 接口 


从 本 书 的 开始 ， 我 们 就 已 经 使 用 和 创建 了 神秘 的 预定 义 error 类 型 ， 但 从 来 没 解释 过 它 
具体 是 什么 。 实 际 上 ， 它 只 是 一 个 接口 类 型 ， 不 含 一 个 返回 错误 消息 的 方法 : 


type error interface { 
Error() string 


} 
构造 error 最 简单 的 方法 是 调用 errors.New， 它 会 返回 一 个 包含 指定 的 错误 消息 的 新 
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error 实例 。 完 整 的 error 包 只 有 如 下 4 行 代码 : 


package errors 
func New(text string) error { return &errorString{text} } 
type errorString struct { text string } 


func (e *errorString) Error() string { return e.text } 


底层 的 errorstring 类 型 是 一 个 结构 ， 而 没有 直接 用 字符 串 ， 主 要 是 为 了 避免 将 来 无 
意 间 的 (或 者 有 预谋 的 ) 布局 变更 。 满 足 error 接口 的 是 *errorstring 指针 ， 而 不 是 原始 
的 errorstring， 主 要 是 为 了 让 每 次 New 分配 的 error 实例 都 互 不 相等 。 我 们 不 希望 出 现 像 
io.EOF 这 样 重 要 的 错误 ， 与 仅仅 包含 同样 错误 消息 的 一 个 错误 相等 。 


fmt.Println(errors.New("EOF") == errors.New("EOF")) // "false" 


直接 调用 errors.New 比较 罕见 ， 因 为 有 一 个 更 易 用 的 封装 函数 fmt.Errorf， 它 还 额外 提 
供 了 字符 串 格式 化 功能 。 这 个 函数 在 第 5 章 中 我 们 已 经 用 过 几 次 了 。 


package fmt 
import "errors" 


func Errorf(format string, args ...interface{}) error { 
return errors.New(Sprintf(format, args...)) 


} 


尽管 *errorstring 可 能 是 最 简单 的 error 类 型 ， 但 这 样 简单 的 error 类 型 远 不 止 一 个 。 
比如 ，syscall 包 提 供 了 Go 语言 的 底层 系统 调用 API。 在 很 多 平台 上 ， 它 也 定义 了 一 个 满足 
error 接口 的 数字 类 型 Errno。 在 UNIX 平 台 上 ，Errno 的 Error 方法 会 从 一 个 字符 串 表 格 中 查 
询 错误 消息 ， 如 下 所 示 : 

package syscall 

type Errno uintptr // 操作 系统 错误 码 


var errors = [...]string{ 
1: 。 "operation not permitted", // EPERM 


2 "no such file or directory", // ENOENT 
33 "no such process", // ESRCH 
/his 


} 


func (e Errno) Error() string { 
if 6 <= int(e) && int(e) < len(errors) { 
return errors[e] 


return fmt.Sprintf("errno %d", e) 


} 
如 下 语句 创建 一 个 接口 值 ， 其 中 包含 值 为 2 的 Errno， 这 个 值 代表 POSIX ENoENT 状态 : 


var err error = syscall.Errno(2) 


fmt.Println(err.Error()) // "没有 文件 或 目录 " 人 
fmt.Println(err) // "没有 文件 或 目录 " 类 型 


err 的 接口 值 如 图 7-6 所 示 。 ” 


Errno 是 一 个 系统 调用 错误 的 高 效 表示 手法 ， 毕 竟 系 统 图 7-6 一 个 包含 syscall.Errno 
调用 错误 是 一 个 有 限 的 集合 ， 尽 管 很 简单 ， 但 是 它 也 满足 标 整数 的 接口 值 
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准 的 error 接口 。 在 7.11 节 中 我 们 可 以 看 到 满足 error 接口 的 其 他 类 型 。 


7.9 示例 : 表达 式 求 值 器 


在 本 节 中 ， 我 们 将 创建 简单 算术 表达 式 的 一 个 求 值 器 。 我 们 将 使 用 一 个 接口 Expr 来 代 
表 这 种 语言 中 的 任意 一 个 表达 式 。 现 在 ， 这 个 接口 没有 任何 方法 ， 但 稍 后 我 们 会 逐个 添加 。 

// Expr: 算术 表达 式 

type Expr interface{} 

我 们 的 表达 式 语言 包括 浮 点 数字 面 量 ， 二 元 操作 符 +、-、* 、/， 一 元 操作 符 -x 和 +x， 
函数 调用 pow(x,y)、sin(x) 和 sqrt(x)， 变 量 (比如 x 和 pi)， 当 然 ， 还 有 圆 括号 和 标准 的 操 
作 符 优先 级 。 所 有 的 值 都 是 float64 类 型 。 下 面 是 几 个 示例 表达 式 : 

sqrt(A / pi) 

pow(x, 3) + pow(y, 3) 

(F - 32)* 5/9 

下 面 5 种 具体 类 型 代表 特定 类 型 的 表达 式 。var 代表 变量 应 用 (很 快 我 们 将 了 解 到 为 什 
么 这 个 类 型 需要 导出 )。1literal 代表 浮 点 数 常量 。unary 和 binary 类 型 代表 有 一 个 或 者 两 个 
操作 数 的 操作 符 表 达 式 ， 而 操作 数 则 可 以 任意 的 Expr。call 代表 函数 调用 ， 这 里 限制 它 的 
fn 字段 只 能 是 pow、sin 和 sqrt。 


gopl1.io/ch7/eval 
// Var 表示 一 个 变量 ， 比 如 x 
type Var string 


// literal 是 一 个 数字 常量 ， 比 如 3.141 
type literal float64 


// unary 表示 一 元 操作 符 表达 式 ， 比 如 -x 
type unary struct { 

op rune //'+'，'-' 中 的 一 个 

x Expr 


} 


// binary 表示 二 元 操作 符 表 达 式 ， 比 如 x+y 
type binary struct { 
op runes /A 的 一 外 
XxX» YY EXpr 


// call 表示 函数 调用 表达 式 ， 比 如 sin(x) 

type call struct { 
fn string // one of "pow", "sin", "sqrt" 中 的 一 个 
args []Expr 


要 对 包含 变量 的 表达 式 进行 求 值 ， 需 要 一 个 上 下 文 (environment) 来 把 变量 映射 到 数值 : 


type Env map[Var]float64 


我 们 还 需要 为 每 种 类 型 的 表达 式 定义 一 个 Eval 方法 来 返回 表达 式 在 一 个 给 定 上 下 文 
下 的 值 。 既 然 每 个 表达 式 都 必须 提供 这 个 方法 ， 那 么 可 以 把 它 加 到 Expr 接口 中 。 这 个 包 
只 导出 了 类 型 Expr、Env 和 var。 客 户 端 可 以 在 不 接触 其 他 表达 式 类 型 的 情况 下 使 用 这 个 求 
值 器 。 
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type Expr interface { 


} 


// Eval 返回 表达 式 在 env 上 下 文 下 的 值 
Eval(env Env) float64 


下 面 是 具体 的 Eval 方法 。var 的 Eval 方法 从 上 下 文中 查询 结果 ， 如 果 变 量 不 存在 则 返回 
0。1literal 的 Eval 方法 则 直接 返回 本 身 的 值 。 


func (v Var) Eval(env Env) float64 { 


} 


return env[v] 


func (1 literal) Eval(_ Env) float64 { 


} 


return float64(1) 


unary 和 binary 的 Eval 方法 首先 对 它们 的 操作 数 递归 求 值 ， 然 后 应 用 op 操作 。 我 们 不 


把 除 以 0 或 者 无 穷 大 当做 错误 (尽管 它们 生成 的 结果 显然 不 是 有 穷 数 )。 最 后 ， 


对 pow、sin 或 者 sqrt 函数 的 参数 求 值 ， 再 调用 math 包 中 的 对 应 函数 。 


func (u unary) Eval(env Env) float64 { 


} 


switch u.op { 
Case '+': 

return +u.x.Eval(env) 
Case '-': 

return -u.x.Eval(env) 


} 
panic(fmt.Sprintf("unsupported unary operator: %q", u.0p)) 


func (b binary) Eval(env Env) float64 { 


} 


switch b.op { 


Case '+': 

return b.x.Eval(env) + b.y.Eval(env) 
Case '-': 

return b.x.Eval(env) - b.y.Eval(env) 
Case@ 本 

return b.x.Eval(env) * b.y.Eval(env) 
case '/': 


return b.x.Eval(env) / b.y.Eval(env) 


panic(fmt.Sprintf("unsupported binary operator: %q", b.op)) 


func (c call) Eval(env Env) float64 { 


} 


Switch c.fn { 
case "pow": 
return math.Pow(c.args[6].Eval(env)，c.args[1].Eval(env)， 
case "sin": 
return math.Sin(c.args[8].Eval(env)) 
case "sqrt": 
return math.Sqrt(c.args[6].Eval(env)) 


} 
panic(fmt.Sprintf("unsupported function call: %s", c.fn)) 


call 方法 先 


某 些 方法 可 能 会 失败 ， 比 如 call 表达 式 可 能 会 遇 到 未 知 的 函数 ， 或 者 参数 数量 不 对 。 
也 有 可 能 用 “!” 或 者 “<” 这 类 无 效 的 操作 符 构造 了 一 个 unary 或 binary 表达 式 (尽管 后 面 
的 Parse 函数 不 会 产生 这 样 的 结果 )。 这 些 错误 都 会 导致 Eval 角 溃 。 其 他 错误 (比如 对 一 个 
上 下 文中 没有 定义 的 变量 求 值 ) 仅 会 导致 返回 不 正确 的 结果 。 所 有 这 些 错 误 都 可 以 在 求 值 之 


前 做 检查 来 发 现 。 后 面 的 check 方法 就 负责 完成 这 个 任务 ， 但 我 们 先 测试 Eval。 
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下 面 的 TestEval 函数 用 于 测试 求 值 器 ， 它 使 用 testing 包 。testing 包 的 详细 情况 会 在 第 
11 章 介 绍 ， 现 在 我 们 只 须知 道 调用 t.Errorf 来 报告 错误 。 这 个 函数 遍历 一 个 表格 ， 表 格 中 
定义 了 三 个 表达 式 并 为 每 个 表达 式 准 备 了 不 同上 下 文 。 第 一 个 表达 式 用 于 根据 圆 面 积 A 求 半 
径 ， 第 二 个 用 于 计算 两 个 变量 x 和 y 的 立方 和 ， 第 三 个 把 华氏 温度 F 转 为 摄氏 温度 。 


func TestEval(t *testing.T) { 
tests := []struct.{ 
expr string 
env Env 
want string 


}{ 
{"sqrt(A / pi)", Env{"A": 87616, "Bis math.pi}, -167"; 
{"pow(x, 3) + pow(y, 3)", Env{"x": 12, "y": 1}, "1729"}, 
{"pow(x, 3) + pow(y, 3)", Env{"x": 9, "y": 16}， "1729"}, 
{SO CEs 32)", EVERY AGO "-40"}, 
{"5 7 9 %* (F= 32)", Env{"F": 32}s, "0"}, 
{Sr Oe (Es S32 ‘EnV Es 212}, "166"}， 
} 
var prevExpr string 
for _, test := range tests { 
// 仅 在 表达 式 变更 时 才 输 出 
if test.expr != prevExpr { 
fmt.Printf("\n%s\n", test.expr) 
prevExpr = test.expr 
} 
expr, err := Parse(test.expr) 
if err != nil { 
t.Error(err) // 解析 出 错 
continue 
got := fmt.Sprintf("%.6g", expr.Eval(test.env)) 
fmt.Printf("\t%v => %s\n", test.env, got) 
if got != test.want { 
t.Errorf("%s.Eval() in %v = %q, want %q\n", 
test.expr, test.env, got, test.want) 
} 
} 


} 

对 于 表格 中 的 每 一 行 记录 ， 该 测试 先 解析 表达 式 ， 在 上 下 文中 求 值 ， 再 输出 表达 式 。 这 
里 没有 足够 的 空间 来 显示 Parse 函数 ， 但 可 以 通过 go get 来 下 载 源码 ， 自 行 查看 。 

go test 命令 (参考 11.1 节 ) 可 用 于 运行 包 的 测试 . 


$ go test -v gopl.io/ch7/eval 


启用 -v 选项 后 可 以 看 到 测试 的 输出 ， 通 常情 况 下 对 于 结果 正确 的 测试 输出 就 不 显示 了 。 
下 面 就 是 测试 中 fmt.Printf 语句 输出 的 内 容 。 


sqrt(A / pi) 
map[A:87616 pi:3.141592653589793] => 167 


pow(x, 3) + pow(y, 3) 
map[x:12 y:1] => 1729 
map[x:9 y:16] => 1729 


5719* (EF. 32) 
map[F:-46] => -46 
map[F:32] => 6 
map[F:212] => 166 
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笠 运 的 是 ， 到 现在 为 止 所 有 的 输入 都 是 合法 的 ， 但 这 种 幸运 是 不 能 持久 的 。 即 使 在 解释 
性 语言 中 ， 通 过 语法 检查 来 发 现 静态 错误 ( 即 不 用 运行 程序 也 能 检测 出 来 的 错误 ) 也 是 很 常 
见 的 。 通 过 分 离 静 态 检 查 和 动态 检查 ， 我 们 可 以 更 快 发 现 错误 ， 也 可 以 只 在 运行 前 检查 一 
次 ， 而 不 用 在 表达 式 求 值 时 每 次 都 检查 。 

让 我 们 给 Expr 方法 加 上 男 外 一 个 方法 。check 方法 用 于 在 表达 式 语法 树 上 检查 静态 错误 。 
它 的 vars 参数 将 稍 后 解释 。 


type Expr interface { 
Eval(env Env) float64 
// Check 方法 报告 表达 式 中 的 错误 ， 并 把 表达 式 中 的 变量 加 入 Vars 中 
Check(vars map[Var]bool) error 


} | 

具体 的 check 方 法 如 下 所 示 。1literal 和 var 的 求 值 不 可 能 出 错 ， 所 以 check 方 法 返回 
nil。unary 和 binary 的 方法 首先 检查 操作 符 是 否 合法 ， 再 递归 地 检查 操作 数 。 类 似 地 ，call 
的 方法 首先 检查 函数 是 否 是 已 知 的 ， 然 后 检查 参数 个 数 是 否 正确 ， 最 后 递归 检查 每 个 参数 。 


func (v Var) Check(vars map[Var]bool) error { 
vars[v] = true 
return nil 


} 


func (literal) Check(vars map[Var]bool) error { 
return nil 


} 


func (u unary) Check(vars map[Var]bool) error { 
if lstrings.ContainsRune("+-", U.op) { 
return fmt.Errorf("unexpected unary op %q", u.op) 
} 
return u.x.Check(vars) 


} 


func (b binary) Check(vars map[Var]bool) error { 
if lstrings.ContainsRune("+-*/", b.op) { 
return fmt.Errorf("unexpected binary op %q", b.op) 


} 

if err := b.x.Check(vars); err != nil { 
return err 

} 


return b.y.Check(vars) 


} 


func (c call) Check(vars map[Var]bool) error { 
arity, ok := numParams[c.fn] 
if lok { 
return fmt.Errorf("unknown function %q", c.fn) 


} 
if len(c.args) != arity { 
return fmt.Errorf("call to %s has %d args, want %d", 
c.fn, len(c.args), arity) 


} 
for _, arg := range c.args { 
if err := arg.Check(vars); err != nil { 
return err 
} 
} 
return nil 


} 


var numParams = map[string]int{"pow": 2, "sin": 1, "sqrt": 1} 
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下 面 分 两 列 展示 了 一 些 有 错误 的 输入 ， 以 及 它们 触发 的 错误 。Parse 函数 (没有 显示 ) 报 
告 了 后 甘 错 误 ，Ccheck 方法 报告 了 语义 错误 。 


X % 2 unexpected '%' 

math .Pi unexpected '."' 

Itrue unexpected "上 

"hello" unexpected '"' 

1og(16) unknown function "log" 

sqrt(1, 2) call to sqrt has 2 args, want 1 


check 的 输入 参数 是 一 个 var 集合 ， 它 收集 在 表达 中 发 现 的 变量 名 。 要 让 表达 式 能 成 功 
求 值 ， 上 下 文 必须 包含 所 有 的 这 些 变量 。 从 逻辑 上 来 讲 ， 这 个 集合 应 当 是 check 的 输出 结果 
而 不 是 输入 参数 ， 但 因为 这 个 方法 是 递归 调用 的 ， 在 这 种 情况 下 使 用 参数 更 为 方便 。 调 用 方 
在 最 初 调用 时 需要 提供 一 个 空 的 集合 。 

在 3.2 节 ， 我 们 绘制 了 一 个 函数 f(x,y)， 不 过 函数 是 在 编译 时 指定 的 。 既 然 我 们 可 以 对 
字符 串 形 式 的 表达 式 进行 解析 、 检 查 和 求 值 ， 那 么 就 可 以 构建 一 个 Web 应 用 ， 在 运行 时 从 
客户 端 接收 一 个 表达 式 ， 并 绘制 函数 的 曲面 图 。 可 以 使 用 vars 集合 来 检查 表达 式 是 一 个 只 
有 两 个 变量 x、y 的 函数 (为 了 简单 起 见 ， 还 提供 了 半径 ">， 所 以 实际 上 是 3 个 变量 )。 使 用 
check 方法 来 拒绝 掉 不 规范 的 表达 式 ， 避 免 了 在 接 下 来 的 40000 次 求 值 中 重复 检查 (4 个 象 
限 中 100 x 100 的 格子 )。 

下 面 的 parseAndcheck 函数 组 合 了 解析 和 检查 步 又: 


gopl1.io/ch7/surface 
import "gopl.io/ch7/eval" 


func parseAndCheck(s string) (eval.Expr, error) { 
if s ==""{ 
return nil, fmt.Errorf("empty expression") 


} 

expr, err := eval.Parse(s) 

if err != nil { 
return nil, err 

vars := make(map[eval.Var]jbool) 

if err := expr.Check(vars); err != nil { 
return nil, err 

} 

for v := range vars { 
if v l= "x" &&v l= "y" 8&&v != "r"{ 

return nil, fmt.Errorf("undefined variable: %s", v) 

} 

} 


return expr, nil 
} 
要 构造 完 这 个 Web 应 用 ， 仅 需要 增加 下 面 的 plot 函数 ， 其 函数 签名 与 http.HandlerFunc 
类 似 : 
func plot(w http.ResponseWriter, r *http.Request) { 
r.ParseForm() 
expr, err := parseAndCheck(r.Form.Get("expr")) 
if err != nil { 
http.Error(w, "bad expr: "+err.Error(), http.StatusBadRequest) 
return 
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w.Header().Set("Content-Type", "image/svg+xml") 
surface(w, func(x, y float64) float64 { 
r := math.Hypot(x，y) // 与 (6,8) 之 间 的 距离 
return expr.Eval(eval.Env{"x": x, "y": y, "r": r}) 


}) 
} 


plot 函数 解析 并 检查 HTTP 请 求 中 的 表达 式 ， 并 用 它 来 创建 一 个 有 两 个 变量 的 匿名 也 
数 。 这 个 匿名 函数 与 原始 曲面 图 绘制 程序 中 的 f 有 同样 的 签名 ， 且 能 对 用 户 提供 的 表达 式 
进行 求 值 。 上 下 文 定义 了 x、y 和 半径 r。 最 后 ，plot 调用 了 surface 函数 ，surface 阴 数 来 
自 gopl.io/ch3/surface 中 的 main 函数 ， 略 做 修改 ， 加 了 参数 用 于 接受 绘制 函数 和 输出 用 的 
io.writer， 原 始 版 本 直接 使 用 了 函数 f 和 os.stdout。 图 7-7 显示 了 用 这 个 程序 绘制 的 三 张 曲 
面 图 。 


六 


ea 


个 localhost:8000/plot?expr=sin(-x)° 


localhost8000/plot7expr=sin(x*y/10X10 








图 7-7 三 个 函数 的 曲面 图 : a) sin(-x)*pow(1.5，-r);b) pow(2, sin(y))*pow(2, sin(x))/12; 
c) sin (x*y/10) /16 
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练习 7.13: 给 Expr 增加 一 个 string 方法 用 来 美化 输出 语法 树 。 要 求生 成 的 语法 树 重新 
解析 后 是 完全 一 致 的 树 。 

练习 7.14: 定义 一 个 新 的 满足 Expr 接口 的 具体 类 ， 提 供 一 个 新 操作 ， 比 如 计算 它 的 操 
作 数 的 最 小 值 。 因 为 Parse 函数 无 法 实例 化 新 创建 的 类 型 ， 所 以 测试 时 需要 直接 构造 语法 树 
(当然 ， 也 可 以 扩充 一 下 解析 函数 )。 

练习 7.15: 写 一 个 程序 从 标准 输入 读 取 一 个 表达 式 ， 提 示 用 户 输 入 表达 式 中 变量 的 值 ， 
最 后 计算 表达 式 的 值 。 请 妥善 处 理 各 种 异常 。 

练习 7.16: 写 一 个 基于 Web 的 计算 器 程序 。 


7.10 ”类 型 断言 

类 型 断言 是 一 个 作用 在 接口 值 上 的 操作 ， 写 出 来 类 似 于 x《T)， 其 中 x 是 一 个 接口 类 型 
的 表达 式 ， 而 T 是 一 个 类 型 ( 称 为 断言 类 型 )。 类 型 断言 会 检查 作为 操作 数 的 动态 类 型 是 否 
满足 指定 的 断言 类 型 。 

这 儿 有 两 个 可 能 。 首 先 ， 如 果断 言 类 型 7 是 一 个 具体 类 型 ， 那么 类 型 断言 会 检查 x 的 动 
态 类 型 是 否 就 是 T。 如 果 检 查 成 功 ， 类 型 断言 的 结果 就 是 x 的 动态 值 ， 类 型 当然 就 是 T。 换 
名 话说 ， 类 型 断言 就 是 用 来 从 它 的 操作 数 中 把 具体 类 型 的 值 提 取出 来 的 操作 。 如 果 检 查 失 
败 ， 那 么 操作 骨 溃 。 比 如 : 


var w io.Writer 
Ww = Os.Stdout 
:= W.(*os.File) // 成 功 : f == os.Stdout 
Cc := W.(*bytes.Buffer) // 崩溃 : 接口 持 有 的 是 *os.File， 不 是 *bytes .Buffer 


其 次 ， 如 果断 言 类 型 T 是 一 个 接口 类 型 ， 那 么 类 型 断言 检查 x 的 动态 类 型 是 否 满足 T。 
如 果 检 查 成 功 ， 动 态 值 并 没有 提取 出 来 ， 结 果 仍 然 是 一 个 接口 值 ， 接 口 值 的 类 型 和 值 部 分 也 
没有 变更 ， 只 是 结果 的 类 型 为 接口 类 型 T。 换 句 话说， 类 型 断言 是 一 个 接口 值 表 达 式 ， 从 一 
个 接口 类 型 变 为 拥有 另外 一 套 方法 的 接口 类 型 (通常 方法 数量 是 增多 )， 但 保留 了 接口 值 中 
的 动态 类 型 和 动态 值 部 分 。 

如 下 类 型 断言 代码 中 , w 和 rw 都 持 有 os.stdout， 于 是 所 有 对 应 的 动态 类 型 都 是 *os. 
File， 但 w 作为 io.writer 仅 暴 露 了 文件 的 write 方法 ， 而 rw 还 暴露 了 它 的 Read 方法 。 


var w io.Writer 
Ww = 0s.Stdout 
rw := Ww.(io.ReadWriter) // 成 功 : *os.File 有 Read 和 Write 方法 


w = new(ByteCounter) 
rw = w.(io.ReadWriter) // 崩溃 : *ByteCounter 没有 Read 方法 


无 论 哪 种 类 型 作为 断言 类 型 ， 如 果 操 作 数 是 一 个 空 接口 值 ， 类 型 断言 都 失败 。 很 少 需 
要 从 一 个 接口 类 型 向 一 个 要 求 更 宽松 的 类 型 做 类 型 断言 ， 该 宽松 类 型 的 接口 方法 比 原 类 型 
的 少 ， 而 且 是 其 子 集 。 因 为 除了 在 操作 nil 之 外 的 情况 下 ， 在 其 他 情况 下 这 种 操作 与 赋值 
一 致 。 


W = rw // io.ReadWriter 可 以 赋 给 io.Writer 
W = rw.(io.Writer) // 仅 当 rw == nil 时 失败 


我 们 经 常 无 法 确定 一 个 接口 值 的 动态 类 型 ， 这 时 就 需要 检测 它 是 否 是 某 一 个 特定 类 型 。 
如 有 果 类 型 断言 出 现在 需要 两 个 结果 的 赋值 表达 式 (比如 如 下 的 代码 ) 中 , 那么 断言 不 会 在 失 
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败 时 崩溃 ， 而 是 会 多 返回 一 个 布尔 型 的 返回 值 来 指示 断言 是 否 成 功 。 


var WwW io.Writer = os.Stdout 
f, ok := WwW.(*os.File) // 成 功 : ok，f == os.Stdout 
b, ok := Ww.(*bytes.Buffer) // 失败 : lok, b == nil 


按照 惯例 ， 一 般 把 第 二 个 返回 值 赋 给 一 个 名 为 ok 的 变量 。 如 果 操 作 失 败 ，ok 为 false， 
而 第 一 个 返回 值 为 断言 类 型 的 零 值 ， 在 这 个 例子 中 就 是 *bytes .Buffer 的 空 指针 。 

ok 返回 值 通常 马上 就 用 来 决定 下 一 步 做 什么 。 下 面 if 表达 式 的 扩展 形式 就 可 以 让 我 们 
写 出 相当 紧凑 的 代码 : 

1f Ff, ok = W.(*ossFile)s ok { 


// .…. 使 用 和 
} 


当 类 型 断言 的 操作 数 是 一 个 变量 时 ， 有 时 你 会 看 到 返回 值 的 名 字 与 操作 数 变量 名 一 致 ， 
原 有 的 值 就 被 新 的 返回 值 掩盖 了 ， 比 如 : | 


if WwW Ok %= WwW;(*ossFile); ‘ok { 
/sdse Woes 


} 


7.11 使 用 类 型 断言 来 识别 错误 ; 

考虑 一 下 os 包 中 的 文件 操作 返回 的 错误 集合 ，I/O 会 因为 很 多 原因 失败 ,但 有 三 类 原因 
通常 必须 单独 处 理 : 文件 已 存储 (创建 操作 )， 文件 没 找到 ( 读 取 操 作 ) 以 及 权限 不 足 。os 包 
提供 了 三 个 帮助 函数 用 来 对 错误 进行 分 类 : 

package os 


func IsExist(err error) bool 
func IsNotExist(err error) bool 
func IsPermission(err error) bool 


一 个 幼稚 的 实现 会 通过 检查 错误 消息 是 否 包含 特定 的 字符 串 来 做 判断 : 


func IsNotExist(err error) bool { 
// 注意 : 不 健壮 
return strings.Contains(err.Error(), "file does not exist") 


} 

但 由 于 处 理 IO 错误 的 逻辑 会 随 着 平台 的 变化 而 变化 ， 因 此 这 种 方法 很 不 健壮 ， 同 样 的 
错误 可 能 会 用 完全 不 同 的 错误 消息 来 报告 。 检 查 错误 消息 是 否 包含 特定 的 字符 串 ， 这 种 方法 
在 单元 测试 中 还 算 够 用 ， 但 对 于 生产 级 的 代码 则 远 远 不 够 。 

一 个 更 可 靠 的 方法 是 用 专门 的 类 型 来 表示 结构 化 的 错误 值 。。s 包 定义 了 一 个 PathError 
类 型 来 表示 在 与 一 个 文件 路 径 相关 的 操作 上 发 生 错误 (比如 open 或 者 pelete)， 一 个 类 似 的 
LinkError 用 来 表述 在 与 两 个 文件 路 径 相 关 的 操作 上 发 生 错误 〈 比 如 symlink 和 Rename)。 下 
面 是 os.pathError 的 定义 : 

package os 


// PathError 记录 了 错误 以 及 错误 相关 的 操作 和 文件 路 径 
type PathError struct { 

Op string 

Path string 

Err error 
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func (e *PathError) Error() string { 
return e.Op +" "+ e.Path + ": " + e.Err.Error() 


} 


很 多 客户 端 忽略 了 PathError， 改 用 一 种 统一 的 方法 来 处 理 所 有 的 错误 ， 即 调用 Error 方 
法 。PathError 的 Error 方 法 只 是 拼接 了 所 有 的 字段 ， 而 PathError 的 结构 则 保留 了 错误 所 有 
的 底层 信息 。 对 于 那些 需要 区 分 错误 的 客户 端 ， 可 以 使 用 类 型 断言 来 检查 错误 的 特定 类 型 ， 
这 些 类 型 包含 的 细节 远 远 多 于 一 个 简单 的 字符 串 。 


_，err := 0s.0pen("/no/such/file") 

fmt.Println(err) // "open /no/such/file: No such file or directory" 
fmt.Printf("%#v\n", err) 

// 输出 : 

// &os.PathError{Op:"open", Path:"/no/such/file", Err:Qx2} 


这 也 是 之 前 三 个 帮助 函数 的 工作 方式 。 比 如 ， 如 下 所 示 的 IsNotExist 判断 错误 是 否 等 于 
syscall.ENOENT (参见 7.8 节 )， 或 者 等 于 另 一 个 错误 os.ErrNotExist (参见 5.4.2 节 的 io.EOF)， 
或 者 是 一 个 *PathError， 并 且 底层 的 错误 是 上 面 二 者 之 一 。 


import ( 
"errors" 
"syscall" 
) 


var ErrNotExist = errors.New("file does not exist") 


// IsNotExist 返回 一 个 布尔 值 ， 该 值 表明 错误 是 否 代表 文件 或 目录 不 存在 
// report that a file or directory does not exist. It is satisfied by 
// ErrNotExist 和 其 他 一 些 系 统 调用 错误 会 返回 true 
func IsNotExist(err error) bool { 
if pe, ok := err.(*PathError); ok { 
err = pe.Err 


} 

return err == syscall.ENOENT || err == ErrNotExist 
] 
实际 使 用 情况 如 下 : 


_，enrr := 0s.0pen("/no/such/file") 
fmt.Println(os.IsNotExist(err)) // "true" 


当然 ， 如 果 错 误 消息 已 被 fmt.Errorf 这 类 的 方法 合并 到 一 个 大 字符 串 中 ， 那 么 PathError 
的 结构 信息 就 丢失 了 。 错 误 识别 通常 必须 在 失败 操作 发 生 时 马上 处 理 ， 而 不 是 等 到 错误 消息 
返回 给 调用 者 之 后 。 


7.12 通过 接口 类 型 断言 来 查询 特性 


下 面 这 段 代码 的 逻辑 类 似 于 net/http 包 中 的 web 服务 器 向 客户 端 响应 诸如 "content- 
type:text/html" 这 样 的 HTTP 头 字段 。io.writer w 代表 HTTP 响应 ， 写 入 的 字 节 最 终 会 发 到 
某 人 的 Web 浏览 器 上 。 


func writeHeader(w io.Writer, contentType string) error { 

if _, err := Ww.Write([]byte("Content-Type: ")); err != nil { 
return err 

} 

if _, err := WwW.Write([]byte(contentType)); err != nil { 
return err 

} 

Lf ns 


因为 write 方法 需要 一 个 字 节 slice， 而 我 们 想 写 人 的 是 一 个 字符 串 ， 所 以 [J]byte(..….) 
转换 就 是 必需 的 。 这 种 转换 需要 进行 内 存 分 配 和 内 存 复制 ， 但 复制 后 的 内 存 又 会 被 马上 抛 
弃 。 让 我 们 假装 这 是 Web 服务 器 的 核心 部 分 ， 而 且 性 能 分 析 表 明 这 个 内 存 分 配 导 致 性 能 下 
降 。 那 么 我 们 能 和 否 避 开 内 存 分 配 呢 ? 

从 io.writer 接口 我 们 仅仅 能 知道 w 中 具体 类 型 的 一 个 信息 ， 那 就 是 可 以 写 入 字 节 slice。 
但 如 果 我 们 深入 0 包 查 看 ， 可 以 看 到 w 对 应 的 动态 类 型 还 支持 一 个 能 高 效 写 入 字符 串 
的 writestring 方法 ， 这 个 方法 避免 了 临时 内 存 的 分 配 和 复制 。( 这 个 有 点 盲目 猜测 ， 但 很 多 
实现 了 io.Writer 0 Writestring 方法， 比如 *bytes.Buffer、*os.File 和 *bufio. 
Write,) 

我 们 无 法 假定 任意 一 个 io.writer w 也 有 writestring 方法 。 但 可 以 定义 一 个 新 的 接口 ， 
这 个 接口 只 包含 writestring 方法 ， 然 后 使 用 类 型 断言 来 判断 w 的 动态 类 型 是 否 满足 这 个 新 
接口 。 


// writeString 将 5s 写 入 WwW 
// 如 果 w 有 WriteSstring 方法 ， 那 么 将 直接 调用 该 方法 
func writeSstring(w io.Writer, s string) (n int, err error) { 
type stringWriter interface { 
WriteString(string) (n int, err error) 





if sw, ok := w.(stringWriter); ok { 
return sw.WriteSstring(s) // py 


} 
return w.Write([]byte(s)) // 分 配 了 临时 内 存 


} 
func writeHeader(w io.Writer, contentType string) error { 
if _, err := writeString(w, "Content-Type: "); err != nil { 
return err 
if _, err := writeString(w, contentType); err != nil { 
return err 
} 
sa 


} 

为 了 避免 代码 重复 ， 我 们 把 检查 挪 到 了 工具 函数 writestring 中 。 实 际 上 ， 标 准 库 提供 
了 io.writestring， 而 且 这 也 是 向 io.writer 写 人 字符 串 的 推荐 方法 。 

这 个 例子 中 比较 古怪 的 地 方 是 并 没有 一 个 标准 的 接口 定义 了 writestring 方法 并 且 指 定 
它 应 满足 的 规范 。 进 一 步 讲 ， 一 个 具体 的 类 型 是 否 满足 stringwriter 接口 仅仅 由 它 拥 有 的 
方法 来 决定 ， 而 不 是 这 个 类 型 与 一 个 接口 类 型 之 间 的 一 个 关系 声明 。 这 意味 着 上 面 的 技术 
依赖 于 一 个 假定 ， 即 如 果 一 个 类 型 满足 下 面 的 接口 ， 那 么 writestring(s) 必须 与 write([] 
byte(s)) 等 效 。 


interface { 
io.Writer 
Writestring(s string) (n int, err error)} 


} 

尽管 io. pt 文档 中 提 到 了 这 个 假定 ， 但 在 调用 它 的 函数 的 文档 中 就 很 少 提 到 这 
个 假定 了 。 给 一 个 特定 类 型 多 定义 一 个 方法 ， 就 隐 式 地 接受 了 一 个 特性 约定 。Go 语言 的 初 
学 者 ， We 背景 的 人 ， 会 对 这 种 缺乏 显 式 约 定 的 方式 感到 不 安 ， 但 在 
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实践 中 很 少 产生 问题 。 撤 开 空 接口 interface{} 不 谈 ， 很 少 有 因为 无 意识 的 巧合 导致 错误 的 
接口 匹配 。 

前 面 的 writestring 函数 使 用 类 型 断言 来 判定 一 个 更 普 适 接口 类 型 的 值 是 否 满足 一 
个 更 专用 的 接口 类 型 ， 如 果 满 足 ， 则 可 以 使 用 后 者 所 定义 的 方法 。 这 种 技术 不 仅 适 用 于 
io.Readwriter 这 种 标准 接口 ， 还 适用 于 stringwriter 这 种 自 定义 类 型 。 

这 个 方法 也 用 在 了 fmt.Printf 中 ， 用 于 从 通用 类 型 中 识别 出 error 或 者 fmt.stringer。 
在 fmt.Fprintf 内 部 ， 有 一 步 是 把 单个 操作 数 转换 为 一 个 字符 串 ， 如 下 所 示 : 


package fmt 


func formatOneValue(x interface{}) string { 
if err, ok := x.(error); ok { 
return err.Error() 


if str, ok := x.(Stringer); ok { 
return str.String() 


} 
// .…. 所 有 其 他 类 型 ... 
} 
如 果 x 满足 这 两 种 接口 中 的 一 个 ， 就 直接 确定 格式 化 方法 。 如 果 不 满足 ， 默 认 处 理 部 分 
大 致 会 使 用 反射 来 处 理 所 有 其 他 类 型 ， 详 细 情 况 在 第 12 章 讨论 。 
再 说 一 次 ， 上 面 的 代码 给 出 了 一 个 假定 ， 任 何 有 String 方法 的 类 型 都 满足 了 fmt. 
Stringer 的 约定 ， 即 把 类 型 转化 为 一 个 适合 输出 的 字符 串 。 


7.13 ”类 型 分 支 


接口 有 两 种 不 同 的 风格 。 第 一 种 风格 下 ， 典 型 的 比如 io.Reader 、io.writer 、fmt.stringer 、 
sort.Interface 、http.Handler 和 error， 接 口上 的 各 种 方法 突出 了 满足 这 个 接口 的 具体 类 型 
之 间 的 相似 性 ， 但 隐藏 了 各 个 具体 类 型 的 布局 和 各 自 特 有 的 功能 。 这 种 风格 强调 了 方法 ， 而 
不 是 具体 类 型 。 

第 二 种 风格 则 充分 利用 了 接口 值 能 够 容纳 各 种 具体 类 型 的 能 力 ， 它 把 接口 作为 这 些 类 型 
的 联合 ( union) 来 使 用 。 类 型 断言 用 来 在 运行 时 区 分 这 些 类 型 并 分 别处 理 。 在 这 种 风格 中 ， 
强调 的 是 满足 这 个 接口 的 具体 类 型 ， 而 不 是 这 个 接口 的 方法 (何况 经 常 没 有 )， 也 不 注重 信 
息 隐 藏 。 我 们 把 这 种 风格 的 接口 使 用 方式 称 为 可 识别 联合 (discriminated union)。 

如 果 你 对 面向 对 象 编程 很 熟悉 ， 那 么 你 就 知道 这 两 种 风格 分 别 对 应 子 类 型 多 态 (subtype 
polymorphism) 和 特 设 多 态 (ad hoc polymorphism)， 当 然 这 些 名 词 并 不 重要 。 本 章 其 余部 分 
将 结合 示例 对 第 二 种 风格 的 接口 进行 讲解 。 

与 其 他 语言 一 样 ，Go 语言 的 数据 库 SQL 查询 API 也 允许 我 们 干净 地 分 离 查询 中 的 不 变 
部 分 和 可 变 部 分 。 一 个 示例 客户 端 如 下 所 示 : 


import "database/sql" 


func listTracks(db sql.DB, artist string, minYear, maxYear int) { 
result, err := db.Exec( 
"SELECT * FROM tracks WHERE artist = ? AND ? <= year AND year <= ?"， 
artist, minYear, maxYear) 
Wf ris 
} 
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Exec 方法 把 查询 字符 串 中 的 每 一 个 “?” 都 替换 为 与 相应 参数 值 对 应 的 SQL 字面 量 ， 这 
些 参 数 可 能 是 布尔 型 、 数 字 、 字 符 串 或 者 nil。 通 过 这 种 方式 构造 请 求 可 以 帮助 避免 SQL 注 
入 攻击， 攻击 者 可 以 通过 在 输入 数据 中 加 入 不 恰当 的 引号 来 控制 你 的 查询 。 在 Exec 的 实现 
代码 中 ， 可 以 发 现 一 个 类 似 如 下 的 函数 ， 将 每 个 参数 值 转 为 对 应 的 SQL 字面 量 。 


func sqlQuote(x interface{}) string { 

fF XR ss LA 
return "NULL" 

} else if _, ok := x.(int); ok { 
return fmt.Sprintf("%d", x) 

} else if _, ok := x.(uint); ok { 
return fmt.Sprintf("%d", x) 

} else if b, ok := x.(bool); ok { 

if b{ 
return "TRUE" 


Re "FALSE” 
} else if s, ok := x.(string); ok { 
return sqlQuotestring(s) // (not shown) 
} else { 
panic(fmt.Sprintf("unexpected type %T: %v", x, x)) 
} 
} 
一 个 switch 语句 可 以 把 包含 一 长 串 值 相等 比较 的 if-else 语句 简化 掉 。 一 个 相似 的 类 型 
分 支 (type switch) 语句 则 可 以 用 来 简化 一 长 串 的 类 型 断言 if-else 语句 。 
类 型 分 支 的 最 简单 形式 与 普通 分 支 语句 类 似 ， 两 个 的 差别 是 操作 数 改 为 x. (type) (注意 : 
这 里 直接 写 关 键 词 type， 而 不 是 一 个 特定 类 型 )， 每 个 分 支 是 一 个 或 者 多 个 类 型 。 类 型 分 支 
的 分 支 判定 基于 接口 值 的 动态 类 型 ， 其 中 nil 分 支 需 要 x == nil， 而 default 分 支 则 在 其 他 
分 支 都 没有 满足 时 才 运 行 。sqlQuote 的 类 型 分 支 会 有 如 下 几 个 : 


Switch x.(type) { 


case nil: pa 
case inty Uints /f/f ,os 
case bool: ff ys 
case string: Lh 
default: J 二 生生 
} 


与 普通 的 switch 语句 (参考 1.8 节 ) 类 似 ， 分 支 是 按 顺 序 来 判定 的 ， 当 一 个 分 支 符合 
时 ， 对 应 的 代码 会 执行 。 分 支 的 顺序 在 一 个 或 多 个 分 支 是 接口 类 型 时 会 变 得 重要 ， 因 为 有 
可 能 两 个 分 支 都 能 满足 。default 分 支 的 位 置 是 无 关 紧 要 的 。 另 外 ， 类 型 分 支 不 允许 使 用 
fallthrough, 

注意 ， 在 原来 的 代码 中 ，bool 和 string 分 支 的 逻辑 需要 访问 由 类 型 断言 提取 出 来 的 原 
始 值 。 这 个 需求 比较 典型 ， 所 以 类 型 分 支 语句 也 有 一 种 扩展 形式 ， 它 用 来 把 每 个 分 支 中 提取 
出 来 的 原始 值 绑 定 到 一 个 新 的 变量 : 

sviteh % ds xtypey {FE var LF 

这 里 把 新 的 变量 也 命名 为 x， 与 类 型 断言 类 似 ， 重 用 变量 名 也 很 普遍 。 与 switch 语句 类 
似 ， 类 型 分 支 也 隐 式 创建 了 一 个 词法 块 ， 所 以 声明 一 个 新 变量 叫 x 并 不 与 外 部 块 中 的 变量 x 
冲突 。 每 个 分 支 也 会 隐 式 创建 各 自 的 词法 块 。 

用 类 型 分 支 的 扩展 形式 重 写 后 的 sqlQuote 就 更 加 清晰 易 读 了 : 
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func sqlQuote(x interface{}) string { 

switch x := x.(type) { 
case nil: 

return "NULL" 
case int, uint: 

return fmt.Sprintf("%d"，Xx) // 这 里 x 类 型 为 interface{} 
case bool: 

区 款 

return "TRUE" 


return "FALSE" 
case string: 

return sqlQuotestring(x) // (未 显示 具体 代码 ) 
default: 

panic(fmt.Sprintf("unexpected type %T: %v", x, x)) 


} 

在 这 个 版 本 中 ， 每 个 单一 类 型 的 分 支 块 内 ， 变 量 x 的 类 型 都 与 该 分 支 的 类 型 一 致 。 比 
如 ， 在 bool 分 支 中 x 的 类 型 是 bool1， 在 string 分 支 中 则 是 string。 在 其 他 分 支 中 ，x 的 类 型 
则 与 switch 的 操作 数 一 致 ， 在 这 个 例子 中 就 是 interface{}。 如 果 多 个 分 支 执行 的 代码 一 致 ， 
比如 本 例 中 的 int 和 uint， 使 用 类 型 分 支 语句 就 方便 很 多 。 

尽管 sqlQuote 支持 任意 类 型 的 实 参 ， 但 仅 当 实 参 类 型 能 够 符合 类 型 分 支 中 的 一 个 时 才能 
正常 运行 到 结束 ， 对 于 其 他 情况 就 会 朋 溃 并 抛 出 一 条 “unexpected type”( 非 期 望 类 型 ) 消息 。 
表面 上 x 的 类 型 是 interface{}， 实 际 上 我 们 把 它 当 作 int 、uint 、bool、 string 和 nil 的 一 个 
可 识别 联合 。 


7.14 示例 : 基于 标记 的 XML 解析 


4.5 节 展 示 了 如 何 用 encoding/json 包 的 Marshal 和 Unmarshal 函数 来 把 JSON 文档 解析 
为 Go 语言 的 数据 结构 。encoding/xml 包 提供 了 一 个 相似 的 API。 当 需要 构造 一 个 完整 文档 
树 的 结构 时 这 很 方便 ， 但 对 于 很 多 程序 这 是 不 必要 的 。encoding/xml 还 为 解析 API 提供 了 一 
个 基于 标记 的 底层 XML。 在 这 些 API 中 ， 解 析 器 读 和 输入 文本 ， 然 后 输出 一 个 标记 流 。 标 
记 流 中 主要 包含 四 种 类 型 : startElement 、EndElement 、charpData 和 comment ， 这 四 种 类 型 都 是 
encoding/xml 包 中 的 一 个 具体 类 型 。 每 次 调用 (*xml.Decoder).Token 都 会 返回 一 个 标记 。 

API 相关 的 部 分 如 下 所 示 。 


encoding/xml 
package xml 


type Name struct { 
Local string // 比如 "Title" 或 者 "id" 


} 

type Attr struct { // 比如 name="value" 
Name Name 
Value string 

} 


// Token 包括 StartElement、EndElement、CharData 和 Comment 
// 以 及 其 他 一 些 具 涩 的 类 型 (未 显示 ) 
type Token interface{} 
type StartElement struct { // 比如 <name> 
Name Name 
Attr []Attr 
) 
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type EndElement struct { Name Name } // 比如 </name> 


type CharData []byte // 比如 <p>CharData</p> 
type Comment []byte // 比如 <1-- Comment --> 
type Decoder struct{ /* ... */ } 


func NewDecoder(io.Reader) *Decoder 
func (*Decoder) Token() (Token，error) // 返回 序列 中 的 下 一 个 标记 


Token 的 接口 没有 任何 方法 ， 这 也 是 一 个 可 识别 联合 的 典型 示例 。 一 个 传统 的 接口 ( 比 
如 io.Reader) 的 目标 是 隐藏 具体 类 型 的 细节 ， 这 样 可 以 轻松 创建 满足 接口 的 新 实现 ， 对 于 每 
一 种 实现 ， 使 用 方 的 处 理 方式 都 是 一 样 的 。 可 识别 联合 类 型 的 接口 正好 与 之 相反 ， 它 的 实现 
类 型 是 固定 的 而 不 是 随意 增加 的 ， 实 现 类 型 是 暴露 的 而 不 是 隐藏 的 。 可 识别 联合 类 型 很 少 有 
方法 ， 操 作 它 的 函数 经 常会 使 用 类 型 switch， 然 后 对 每 种 类 型 应 用 不 同 的 逻辑 。 

下 面 的 xmlselect 程序 提取 并 输出 XML 文档 树 中 特定 元 素 下 的 文本 。 利 用 上 面 的 API， 
可 以 在 一 遍 扫描 中 就 完成 这 个 任务 ， 还 不 用 生成 相应 的 文档 树 。 


gopl.io/ch7/xmlselect 
// Xmlselect 输出 XML 文档 中 指定 元 素 下 的 文本 


package main 





import ( 
"encoding/xml" 

"fmt" 

"jo" 

"os" 

"strings" 


) 


func main() { 
dec := xml.NewDecoder(os.Stdin) 
var stack []string // 元 素 名 的 栈 
for { 
tok, err := dec.Token() 
if err == io.EOF { 


break 

} else if err != nil { 
fmt.Fprintf(os.Stderr, "xmlselect: %v\n", err) 
vs. EXit(LY 


switch tok := tok.(type) { 
case xml.StartElement: 
stack = append(stack，tok.Name.Local) // 入 栈 
case xml.EndElement: 
stack = stack[:len(stack)-1] // 出 栈 
case xml.CharData: 
if containsAll(stack, os.Args[1:]) { 
fmt.Printf("%s: %s\n", strings.Join(stack, " "), tok) 
} 


} 


// containsAll 判断 x 是 否 包 含 y 中 的 所 有 元 素 ， 且 顺序 一 致 
func containsAll(x, y []string) bool { 
for len(y) <= len(x) { 
if len(y) == 0 { 
return true 


} 
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if x[6] == y[6] { 
y = y[1:] 
} 
x 
} 


return false 


= x[1:] 


} 

在 main 函数 的 每 次 循环 中 ， 如 果 遇 到 startElement， 就 把 元 素 的 名 字 人 栈 ， 遇 到 
EndElement 则 把 元 素 名 字 出 栈 。API 保证 了 startElement 和 EndElement 标记 是 正确 匹配 的 ， 
对 于 不 规范 的 文档 也 是 如 此 。comments 被 忽略 了 。 当 xmlselect 遇 到 charpata 时 ， 如 果 栈 中 
的 元 素 名 按 顺 序 包含 命令 行 参数 中 给 定 的 名 称 ， 就 输出 对 应 的 文本 。 

如 下 命令 输出 了 在 两 层 div 元 素 下 hz 元 素 的 内 容 。 输 入 的 内 容 是 XML 规范 ， 这 份 规范 
本 身 也 是 一 个 XML 文档 : 


$ go build gopl.io/ch1i/fetch 

$ ./fetch http://www.w3.org/TR/2686/REC-xm111-26866816 | 
./xmlselect div div h2 

html body div div h2: 1 Introduction 

html body div div h2: 2 Documents 

html body div div h2: 3 Logical Structures 

html body div div h2: 4 Physical Structures 

html body div div h2: 5 Conformance 

html body div div h2: 6 Notation 

html body div div h2: A References 

html body div div h2: B Definitions for Character Normalization 


练习 7.17 : 扩展 xmlselect， 让 我 们 不 仅 可 以 用 名 字 ， 还 可 以 用 CSS 风格 的 属性 来 做 
选择 。 比 如 一 个 <div id="page" class="wide"> 元 素 ， 不 仅 可 以 通过 名 字 ， 还 可 以 通过 id 和 
class 来 做 匹配 

练习 7.18 : 使 用 基于 标记 的 解析 API， 写 一 个 程序 来 读 和 人 一 个 任意 的 XML 文档 ， 构 造 
出 一 棵 树 来 展现 XML 中 的 主要 节点 。 节 点 包括 两 种 类 型 : charpata 节点 表示 文本 字符 串 ， 
Element 节点 表示 元 素 及 其 属性 。 每 个 元 素 节点 包含 它 的 子 节点 数组 。 

可 以 参考 如 下 类 型 定义 : 


import "encoding/xml" 
type Node interface{} // CharData 或 *Element 
type CharData string 


type Element struct { 
Type xml .Name 
Attr [J]xml.Attr 
Children []Node 

} 


7.15 一 些 建 议 


当 设计 一 个 新 包 时 ， 一 个 新 手 Go 程序 员 会 首先 创建 一 系列 接口 ， 然 后 再 定义 满足 这 些 
接口 的 具体 类 型 。 这 种 方式 会 产生 很 多 接口 ， 但 这 些 接口 只 有 一 个 单独 的 实现 。 不 要 这 样 
做 。 这 种 接口 是 不 必要 的 抽象 ， 还 有 运行 时 的 成 本 。 可 以 用 导出 机 制 (参考 6.6 节 ) 来 限制 
一 个 类 型 的 哪些 方法 或 结构 体 的 哪些 字段 是 对 包 外 可 见 的 。 仅 在 有 两 个 或 者 多 个 具体 类 型 需 
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要 按 统一 的 方式 处 理 时 才 需 要 接口 。 

这 个 规则 也 有 特例 ， 如 果 接 口 和 类 型 实现 出 于 依赖 的 原因 不 能 放 在 同一 个 包 里 边 ， 那 么 
一 个 接口 只 有 一 个 具体 类 型 实现 也 是 可 以 的 。 在 这 种 情况 下 ， 接 口 是 一 种 解 看 两 个 包 的 好 
方式 。 

因为 接口 仅 在 有 两 个 或 者 多 个 类 型 满足 的 情况 下 存在 ， 所 以 它 就 必然 会 抽象 掉 那 些 特有 
的 实现 细节 。 这 种 设计 的 结果 就 是 出 现 了 具有 更 简单 和 更 少 方法 的 接口 ， 比 如 io.writer 和 
fmt.stringer 都 只 有 一 个 方法 。 设 计 新 类 型 时 越 小 的 接口 越 容易 满足 。 一 个 不 错 的 接口 设计 
经 验 是 仅 要 求 你 需要 的 。 

本 音 关于 方法 和 接口 的 讲解 就 结束 了 。Go 语言 能 很 好 地 支持 面向 对 象 编程 风格 ， 但 这 
并 不 意味 着 你 只 能 使 用 它 。 不 是 所 有 东西 都 必须 是 一 个 对 象 ， 全 局 函数 应 该 有 它们 的 位 置 ， 
不 完全 封装 的 数据 类 型 也 应 该 有 位 置 。 综 合 来 看 ， 在 本 书 第 1 章 一 第 5 章 的 示例 中 ， 我 们 
用 到 的 方法 (比如 input.scan) 不 超过 两 打 ， 这 与 诸如 fmt.Printf 之 类 的 普通 函数 比 起 来 并 
不 多 。 
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并 发 编程 表现 为 程序 由 若干 个 自主 的 活动 单元 组 成 ， 它 从 来 没有 像 今 天 这 样 重要 。Web 
服务 器 可 以 一 次 处 理 数 千 个 请 求 。 平 板 电脑 和 手机 应 用 在 泻 染 用 户 界 面 的 同时 ， 后 端 还 同步 
进行 着 计算 和 处 理 网 络 请 求 。 其 至 传统 的 批 处 理 任务 一 一 读 取 数据 、 计 算 、 将 结果 输出 一 一 
也 使 用 并 发 来 隐藏 /O 操作 的 延迟 ， 充 分 利用 现代 的 多 核 计算 机 ， 内 核 的 个 数 每 年 变 多 ,但 
是 速度 没什么 变化 。 

Go 有 两 种 并 发 编程 的 风格 。 这 一 章 展示 goroutine 和 通道 ( channel)， 它 们 支持 通信 顺 
序 进程 (Communicating Sequential Process, CSP), CSP 是 一 个 并 发 的 模式 ， 在 不 同 的 执行 
体 ( goroutine) 之 间 传 递 值 ， 但 是 变量 本 身 局 限于 单一 的 执行 体 。 第 9 章 涵盖 一 些 共 享 内 存 
多 线程 的 传统 模型 ， 它 们 和 在 其 他 主流 语言 中 使 用 线程 类 似 。 第 9 章 也 会 指 ! 1 一 些 关 于 并 发 
编程 的 重要 难题 和 陷阱 ， 这 里 暂 不 深入 介绍 。 

即使 Go 对 并 发 的 支持 是 其 很 大 的 长 处 ， 并 发 编程 在 本 质 上 也 比 顺序 编程 要 困难 一 些 ， 
从 顺序 编程 获取 的 直觉 让 我 们 加 倍 地 迷茫 。 如 果 这 是 你 第 一 次 遇 到 并 发 ， 建议 多 花 一 点 时 间 
思考 这 两 章 的 例子 。 


8.1 goroutine 


在 Go 里 ， 每 一 个 并 发 执行 的 活动 称 为 goroutine。 考 虑 一 个 程序 ， 它 有 两 个 函数 ， 一 个 
做 一 些 计算 工作 ， 另 一 个 将 结果 输出 ， 假 设 它们 不 相互 调用 。 顺 序 程序 可 能 调用 一 个 函数 ， 
然后 调用 另 一 个 ， 但 是 在 有 两 个 或 多 个 goroutine 的 并 发 程序 中 ， 两 个 函数 可 以 同时 执行 。 
很 快 我 们 将 看 到 这 样 的 程序 。 
如 果 你 使 用 过 操作 系统 或 者 其 他 语言 中 的 线程 ， 可 以 假设 goroutine 类 似 于 线程 ， 然 后 
写 出 正确 的 程序 。goroutine 和 线程 之 间 在 数量 上 有 非常 大 的 差别 ， 这 将 在 9.8 节 进 行 讨论 。 
当 一 个 程序 启动 时 ， 只 有 一 个 goroutine 来 调用 main 男 数 ， 称 它 为 主 goroutine。 新 的 
goroutine 通过 go 语句 进行 创建 。 语 法 上 ， 一 个 go 语句 是 在 普通 的 函数 或 者 方法 调用 前 加 上 
go 关键 字 前 级 。go 语句 使 函数 在 一 个 新 创建 的 goroutine 中 调用 。go 语句 本 身 的 执行 立即 完成 : 
f() ”// 调用 f(); 等 待 它 返 回 
go f() // 新 建 一 个 调用 f() 的 goroutine， 不 用 等 待 
下 面 的 例子 中 ， 主 goroutine 计算 第 45 个 斐 波 那 契 数 。 因为 它 使 用 非常 低 效 的 递归 算 
法 ， 所 以 它 需 要 大 量 的 时 间 来 执行 ， 在 此 期 间 我 们 提供 一 个 可 见 的 提示 ， 显 示 一 个 字符 串 
“spinner” 来 指示 程序 依然 在 运行 。 
gopl1.io/ch8/spinner 
func main() { 
go spinner(168 * time.Millisecond) 
const n = 45 
fibN := fib(n) // slow 


fmt.Printf("\rFibonacci(%d) = %d\n", n, fibN) 
} 


出 。 


人 


8g0routine 和 通道 171 


func spinner(delay time.Duration) { 
for { 
for _,r := range *.-\|/ { 
fmt.Printf("\r%c", r) 
time.Sleep(delay) 


} 
} 
} 
func fib(x int) int { 
pH 
return x 


} 
return fib(x-1) + fib(x-2) 


若干 秒 后 ，fib(45) 返回 ，main 函数 输出 结果 : 
Fibonacci(45) = 1134903170 


然后 main 函数 返回 ， 当 它 发 生 时 ， 所 有 的 goroutine 都 暴力 地 直接 终结 ， 然 后 程序 退 
除了 从 main 返回 或 者 退出 程序 之 外 ， 没 有 程序 化 的 方法 让 一 个 goroutine 来 停止 另 一 
， 但 是 像 我 们 将 要 看 到 的 那样 ， 有 办 法 和 goroutine 通信 来 要 求 它 自己 停止。 

注意 程序 如 何 由 两 个 自主 的 活动 《指示 器 和 斐 波 那 契 数 计算 ) 来 表达 。 它 们 写成 独立 的 


函数 ， 但 是 同时 在 运行 。、 


8. 


2 示例 : 并 发 时 钟 服务 器 
网 络 是 一 个 自然 使 用 并 发 的 领域 ， 因 为 服务 器 通常 一 次 处 理 很 多 来 自 客户 端的 连接 ， 每 


一 个 客户 端 通常 和 其 他 客户 端 保持 独立 。 本 节 介 绍 net 包 ， 它 提供 构建 客户 端 和 服务 器 程序 


的 


组 件 ， 这 些 程序 通过 TCP、UDP 或 者 UNIX 套 接 字 进 行 通信 。 第 1 章 使 用 过 的 net/http 


包 是 在 net 包 基 础 上 构建 的 。 


第 一 个 例子 是 顺序 时 钟 服务 器 ， 它 以 每 秒 钟 一 次 的 频率 向 客户 端 发 送 当 前 时 间 
gopl.io/ch8/clock1 


// clock1 是 一 个 定期 报告 时 间 的 TCP 服务 器 
package main 


import ( 
"jo" 
"log" 
net" 
time" 
) 


func main() { 
listener, err := net.Listen("tcp", "localhost:8680") 
if err != nil { 
log.Fatal(err) 


} 
for { 
conn, err := listener.Accept() 
if err != nil 
log.Print(err) // 例如 ， 连 接 中 止 
continue 


handleConn(conn) // 一 次 处 理 一 个 连接 
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func handleConn(c net.Conn) { 

defer c.Close() 

for { 
， err := io.Writestring(c, time.Now().Format("15:64:05\n")) 
if err != nil { 


return // 例如 ， 连 接 断 开 


time.Sleep(1 * time.Second) 


J 


Listen 国 数 创建 一 个 net.Listener 对 象 ， 它 在 一 个 网 络 端口 上 监听 进来 的 连接 ， 这 里 
是 TCP 端口 localhost:8686。 监 听 器 的 Accept 方法 被 阻塞 ， 直 到 有 连接 请 求 进来 ， 然 后 返回 
net .Conn 对 象 来 代表 一 个 连接 。 

handleConn 困 数 处 理 一 个 完整 的 客户 连接 。 在 循环 里 ， 它 将 time.Now() 获取 的 当前 时 间 
发 送 给 客户 端 。 因 为 net.conn 满足 io.writer 接口 ， 所 以 可 以 直接 向 它 进行 写 信 。 当 写 入 失 
败 时 循环 结束 ， 很 多 时 候 是 客户 端 断 开 连接 ， 这 时 handleconn 函数 使 用 延迟 的 close 调用 关 
闭 自 己 这 边 的 连接 ， 然 后 继续 等 待 下 一 个 连接 请 求 。 

time.Time.Format 方法 提供 了 格式 化 日 期 和 时 间 信 息 的 方式 。 它 的 参数 是 一 个 模板 ， 指 示 
如 何 格式 化 一 个 参考 时 间 ， 具 体 如 Mon Jan 2 63:64:65PM 2666 UTC-8769 这 样 的 形式 。 人 参考 时 间 有 
8 个 部 分 (本 周 第 几 天 、 月 、 本 月 第 几 天 ， 等 等 )。 它 们 可 以 以 任意 的 组 合 和 对 应 数目 的 格式 
化 字符 出 现在 格式 化 模板 中 ， 所 选择 的 日 期 和 时 间 将 通过 所 选择 的 格式 进行 显示 。 这 里 只 使 
用 时 间 的 小 时 、 分 钟 和 秒 部 分 。time 包 定 义 了 许多 标准 时 间 格 式 的 模板 ， 如 time.RFc1123。 相 
反 ， 当 解析 一 个 代表 时 间 的 字符 串 的 时 候 使 用 相同 的 机 制 。 

为 了 连接 到 服务 器 ， 需 要 一 个 像 nc (“netcat”) 这 样 的 程序 ， 以 及 一 个 用 来 操作 网 络 连 
接 的 标准 工具 : 

$ go build gopl.io/ch8/clockl 

$ ./clockl & 

$ nc localhost 8666 

13:58:54 

L358:55 

13558:56 

13:58:57 

AC 

客户 端 显示 每 秒 从 服务 器 发 送 的 时 间 ， 直 到 使 用 Control+C 快捷 键 中 断 它 ，UNIX 系统 
shell 上 面 回 显 为 ^<。 如 果 系 统 上 没有 安装 nc 或 netcat， 可 以 使 用 telnet 或 者 一 个 使 用 net. 
Dial 实现 的 Go 版 的 netcat 来 连接 TCP 服务 器 : 

gopl.io/ch8/netcat1 


// netcat1 是 一 个 只 读 的 TCP 客户 端 程序 
package main 





import ( 
"io" 
"1og" 
"net" 
"os" 
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func main() { 
conn, err := net.Dial("tcp", "localhost:88860") 
if err != nil { 
log.Fatal(err) 


defer conn.Close() 
mustCopy(os.Stdout, conn) 


} 
func mustCopy(dst io.Writer, src io.Reader) { 
if _, err := io.Copy(dst, src); err != nil { 
log.Fatal(err) 
} 
} 


这 个 程序 从 网 络 连接 中 读 取 ， 然 后 写 到 标准 输出 ， 直 到 到 达 EOF 或 者 出 错 。mustcopy 
函数 是 这 一 节 的 多 个 例子 中 使 用 的 一 个 实用 程序 。 在 不 同 的 终端 上 同时 运行 两 个 客户 端 ， 一 
个 显示 在 左边 ， 一 个 在 右边 : 


$ go build gopl.io/ch8/netcat1 


$ ./netcat1 
13:58:54 $ ./netcat1 
L358.55 
13:58:56 
AC 
13:58;57 
13:58:58 
13%58:59 
SE 


$ killall clockl : 


killall 命令 是 UNIX 的 一 个 实用 程序 ， 用 来 终止 所 有 指定 名 字 的 进程 。 

第 二 个 客户 端 必须 等 到 第 一 个 结束 才能 正常 工作 ， 因 为 服务 器 是 顺序 的 ， 一 次 只 能 处 理 
一 个 客户 请 求 。 让 服务 器 支持 并 发 只 需要 一 个 很 小 的 改变 : 在 调用 handleconn 的 地 方 添加 一 
个 go 关键 字 ， 使 它 在 自己 的 goroutine 内 执行 。 


gopl.io/ch8/clock2 
for { 
conn, err := listener.Accept() 
if err != nil { 
log.Print(err) // 例如 ， 连 接 中 止 


continue 


} 
go handleConn(conn) // 并 发 处 理 连接 
} 


现在 ， 多 个 客户 端 可 以 同时 接收 到 时 间 : 


$ go build gopl.io/ch8/clock2 


$ ./clock2 & 

$ go build gopl.io/ch8/netcat1 

$ ./netcat1 

14:62:54 $ ./netcat1 
14:62:55 14:62:55 
14:62:56 14:82:56 
14:82:57 EC 

14:602:58 

14:02359 $ ./netcat1 
14:603:66 14:63:66 


14:63:61 14:63:61 
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AGE 14:63:62 
NC 

$ killall clock2 

练习 8.1: 修改 clock2 来 接收 一 个 端口 号 ， 写 一 个 程序 clockwall， 作 为 多 个 时 钟 服务 
需 的 客户 端 ， 读 取 每 一 个 服务 器 的 时 间 ， 类 似 于 不 同 地 区 办 公 室 的 时 钟 ， 然 后 显示 在 一 个 表 
中 。 如 果 可 以 访问 不 同 地 域 的 计算 机 ， 可 以 远程 运行 示例 程序 ， 否则 可 以 伪装 不 同 的 时 区 ， 
在 不 同 的 端口 上 本 地 运行 : 

$ TZ=US/Eastern ./clock2 -port 8616 & 

$ TZ=Asia/Tokyo ./clock2 -port 8636 & 

$ TZ=Europe/London ./clock2 -port 8626 & 

$ clockwall NewYork=1localhost:8616 London=localhost:8626 Tokyo=localhost:8636 

练习 8.2: 实现 一 个 并 发 的 FTP 服务 器 。 服 务 器 可 以 解释 从 客户 端 发 来 的 命令 ， 例 如 cd 
用 来 改变 目录 ，1s 用 来 列 出 目录 ，get 用 来 发 送 一 个 文件 的 内 容 ，close 用 来 关闭 连接 。 可 
以 使 用 标准 的 ftp 命令 作为 客户 端 ， 或 者 自己 写 一 个 。 


8.3 示例: 并 发 回声 服务 器 


时 钟 服务 器 每 个 连接 使 用 一 个 goroutine。 在 这 一 节 ， 我 们 要 构建 一 个 回声 服务 器 ， 每 
个 连接 使 用 多 个 goroutine 来 处 理 。 大 多 数 的 回声 服务 器 仅仅 将 读 到 的 内 容 写 回去 ， 它 可 以 
使 用 下 面 简单 的 handleconn 版 本 完成 : 


func handleConn(c net.Conn) { 
io.Copy(c，c) // 注意 : 忽略 错误 
c.Close() 


更 有 趣 的 回声 服务 器 可 以 模仿 真实 的 回声 ， 第 一 次 大 的 回声 ( "Ettol")， 在 一 定 延迟 后 
中 等 音量 的 回声 ("Hello1")， 然 后 安静 的 回声 (“hello1")， 最 后 什么 都 没有 了 ， 如 下 面 这 个 
版 本 的 handleconn 所 示 : 


gop1. io/ch8/reverb1 

func echo(c net.Conn, shout string, delay time.Duration) { 
fmt.Fprintln(c, "\t", strings.ToUpper(shout)) 
time.Sleep(delay) 
fmt.Fprintln(c, "\t", shout) 
time.Sleep(delay) 
fmt.Fprintln(c, "\t", strings.ToLower(shout)) 

} 


func handleConn(c net.Conn) { 
input := bufio.NewScanner(c) 
for input.Scan() { 
echo(c, input.Text(), 1*time.Second) 


} 
// 注意 : 忽略 input.Err() 中 可 能 的 错误 
c.Close() 

} 


我 们 需要 升级 客户 端 程序 ， 使 它 可 以 在 终端 上 向 服务 器 输入 ， 还 可 以 将 服务 器 的 回复 复 
制 到 输出 ， 这 里 提供 了 另 一 个 使 用 并 发 的 机 会 : 
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gopl.io/ch8/netcat2 
func main() { 
conn, err := net.Dial("tcp", "localhost:8660") 
if err l= nil { 
log.Fatal(err) 





defer conn.Close() 
go mustCopy(os.Stdout, conn) 
mustCopy(conn, os.Stdin) 


} 


当主 goroutine 从 标准 输入 读 取 并 发 送 到 服务 器 的 时 候 ， 第 二 个 goroutine 读 取 服务 器 
的 回复 并 且 输 出 。 当 主 goroutine 的 输入 结束 时 ， 例 如 用 户 在 终端 按 人 Control+D (^D) 组 
合 键 (或 者 在 微软 Windows 平台 上 按 Control+Z 组 合 键 ) 时 ， 这 个 程序 停止 ， 即 使 其 他 的 
goroutine 还 在 运行 。( 8.4.1 节 展 示 如 何 通过 引入 通道 来 等 待 两 边 一 起 结束 。) 

下 面 这 段 场景 中 ， 客 户 端的 输入 左 对 齐 ， 服 务 器 的 回复 是 缩 进 的 。 客 户 端 向 回声 服务 器 
呼叫 三 次 : : 


$ go build gopl.io/ch8/reverb1 
$ ./reverbl & 
$ go build gopl.io/ch8/netcat2 
$ ./netcat2 
Hello? 
HELLO? 
Hello? 
hello? 
Is there anybody there? 
IS THERE ANYBODY THERE? 
Yooo-hoool 
Is there anybody there? 
is there anybody there? 
Y000-HOOO! 
Yooo-hoool 
yooo-hoool 
^D 
$ killall reverb1 


注意 ， 第 三 次 从 客户 端 进行 的 呼叫 直到 第 二 次 回声 枯竭 才 进 行 处 理 ， 这 个 不 是 非常 切 
合 现实 。 真 实 的 回声 会 由 三 个 独立 的 呼喊 回声 合 加 组 成 。 为 了 模仿 它 ， 我 们 需要 更 多 的 
goroutine。 再 一 次 ， 在 调用 echo 时 加 入 go 关键 字 : 


gopl1.io/ch8/reverb2 
func handleConn(c net.Conn) { 
input := bufio.NewScanner(c) 
for input.Scan() { 
go_ echo(c, input.Text(), 1*time.Second) 


} 
// 注意 : 忽略 input.Err() 中 可 能 的 错误 


c.Close() 
} 
当 go 语句 执行 的 时 候 ， 计 算 echo 函 数 所 对 应 的 参数 ; 所 以 input.Text() 是 在 主 
goroutine 中 推演 。 


现在 的 回声 是 并 发 的 ， 在 时 间 上 面相 互 重合 : 
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$ go build gopl.io/ch8/reverb2 
$ ./reverb2 & 
$ ./netcat2 
Is there anybody there? 
IS THERE ANYBODY THERE? 


Yooo-hoool 
Is there anybody there? 
Y000-HOOO! 
is there anybody there? 
Yoo0-hooo! 
yooo-hoool! 
AD 
$ killall reverb2 
这 就 是 使 服务 器 变 成 并 发 所 要 做 的 ， 不 仅 处 理 来 自 多 个 客户 端的 链接 ， 还 包括 在 一 个 连 
接 处 理 中 ,使 用 多 个 go 关键 字 。 
然而 ， 在 添加 这 些 go 关键 字 的 同时 ， 必 须要 仔细 考虑 方法 net.conn 的 并 发 调用 是 不 是 
安全 的 ， 对 大 多 数 类 型 来 讲 ， 这 都 是 不 安全 的 。 下 一 章 讨论 并 发 的 安全 性 问题 。 
8.4 通道 
如 果 说 goroutine 是 Go 程序 并 发 的 执行 体 ， 通 道 就 是 它们 之 间 的 连接 。 通 道 是 可 以 让 
一 个 goroutine 发 送 特定 值 到 另 一 个 goroutine 的 通信 机 制 。 每 一 个 通道 是 一 个 具体 类 型 的 导 
管 ， 叫 作 通道 的 元 素 类 型 。 一 个 有 int 类 型 元 素 的 通道 写 为 chan int。 
使 用 内 置 的 make 函数 来 创建 一 个 通道 
ch := make(chan int) // ch 的 类 型 是 'chan int' 


像 map 一 样 ， 通道 是 一 个 使 用 make 创建 的 数据 结构 的 引用 。 当 复制 或 者 作为 参数 传递 
到 一 个 函数 时 ， 复 制 的 是 引用 ， 这 样 调用 者 和 被 调用 者 都 引用 同一 份 数 据 结构 。 和 其 他 引用 
类 型 一 样 ， 通 道 的 零 值 是 nil。 

同 种 类 型 的 通道 可 以 使 用 == 符号 进行 比较 。 当 二 者 都 是 同一 通道 数据 的 引用 时 ， 比 较 
值 为 true。 通 道 也 可 以 和 nil 进行 比较 。 

通道 有 两 个 主要 操作 : 发 送 (send) 和 接收 (receive)， 两 者 统称 为 通信 。send 语句 从 一 
个 goroutine 传输 一 个 值 到 另 一 个 在 执行 接收 表达 式 的 goroutine。 两 个 操作 都 使 用 <- 操作 符 
书写 。 发 送 语句 中 ， 通 道 和 值 分 别 在 *- 的 左右 两 边 。 在 接收 表达 式 中 ，<- 放 在 通道 操作 数 
前 面 。 在 接收 表达 式 中 ， 其 结果 未 被 使 用 也 是 合法 的 。 

ch <- x // 发 送 语句 

Xx = <-ch // 赋值 语句 中 的 接收 表达 式 

<-ch // 接收 语句 ， 丢 弃 结果 

通道 支持 第 三 个 操作 : 关闭 (close)， 它 设置 一 个 标志 位 来 指示 值 当 前 已 经 发 送 完毕 ， 
这 个 通道 后 面 没 有 值 了 ; 关闭 后 的 发 送 操作 将 导致 宕 机 。 在 一 个 已 经 关闭 的 通道 上 进行 接收 
操作 ， 将 获取 所 有 已 经 发 送 的 值 ， 直 到 通道 为 空 ， 这 时 任何 接收 操作 会 立即 完成 ， 同 时 获取 
到 一 个 通道 元 素 类 型 对 应 的 零 值 。 

调用 内 置 的 close 函数 来 关闭 通道 


close(ch) 


使 用 简单 的 make 调用 创建 的 通道 叫 无 缓冲 (unbuffered) 通道 , 但 make 还 可 以 接受 第 二 
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个 可 选 参数 ， 一 个 表示 通道 容量 的 整数 。 如 果 容 量 是 0，make 创建 一 个 无 缓冲 通道 : 


ch = make(chan int) // 无 缓冲 通道 
ch = make(chan int，6) // 无 缓冲 通道 
ch = make(chan int，3) // 容量 为 3 的 缓冲 通道 


首先 介绍 无 缓冲 通道 ， 缓 冲 通道 将 在 8.4.4 节 讨论 。 


8.4.1 无 缓冲 通道 


无 缓冲 通道 上 的 发 送 操作 将 会 阻塞 ， 直 到 另 一 个 goroutine 在 对 应 的 通道 上 执行 接收 操 
作 ， 这 时 值 传送 完成 ， 两 个 goroutine 都 可 以 继续 执行 。 相 反 ， 如 果 接 收 操作 先 执行 ， 接 收 
方 goroutine 将 阻塞 ， 直 到 另 一 个 goroutine 在 同一 个 通道 上 发 送 一 个 值 。 

使 用 无 缓冲 通道 进行 的 通信 导致 发 送 和 接收 goroutine 同步 化 。 因 此 ， 无 缓冲 通道 也 称 
为 同步 通道 。 当 一 个 值 在 无 缓冲 通道 上 传递 时 ， 接 收 值 后 发 送 方 goroutine 才 被 再 次 唤醒 。 

在 讨论 并 发 的 时 候 ， 当 我 们 说 x 早 于 yy 发生 时 ,不 仅仅 是 说 x 发 生 的 时 间 早 于 y， 而 是 
说 保证 它 是 这 样 ， 并 且 是 可 预期 的 ， 比 如 更 新 变量 ， 我 们 可 以 依赖 这 个 机 制 。 

当 x 既 不 比 y 早 也 不 比 y 晚 时 ， 我们 说 x 和 yy 并 发 。 这 不 意味 着 ，x 和 yy 一 定 同 时 发 生 ， 
只 说 明 我 们 不 能 假设 它们 的 顺序 。 下 一 章 中 我 们 将 看 到 ， 在 两 个 goroutine 并 发 地 访问 同一 
个 变量 的 时 候 ， 有 必要 对 这 样 的 事件 进行 排序 ， 避 人 免 程序 的 执行 发 生 问题 。 

8.3 节 中 的 客户 端 程序 在 主 goroutine 中 将 输入 复制 到 服务 器 中 ， 这 样 客户 端 在 输入 接收 
后 立即 退出 ， 即 使 后 台 的 goroutine 还 在 继续 。 为 了 让 程序 等 待 后 台 的 goroutine 在 完成 后 再 
退出 ， 使 用 一 个 通道 来 同步 两 个 goroutine: 

gopl.io/ch8/netcat3 
func main() { 
conn, err := net.Dial("tcp"，"1ocalhost:8666") 
if err != nil { 


log.Fatal(err) 
} 
done := make(chan struct{}) 
go func() { 
io.Copy(os.Stdout，conn) // 注意 : 忽略 错误 
log.Println("done") 
done <- struct{}{} // 指示 主 goroutine 
J 
mustCopy(conn, os.Stdin) 
conn.Close() 
<-done // 等 待 后 台 goroutine 完成 
} 


当 用 户 关 闭 标准 输入 流 时 ，mustcopy 返回 ， 主 goroutine 调用 conn.close() 来 关闭 两 端 网 
络 连 接 。 关 闭 写 半 边 的 连接 会 导致 服务 器 看 到 EOF。 关 闭 读 半边 的 连接 导致 后 台 goroutine 调 
用 io.copy 返回 “ read from closed connection ”错误 ， 这 也 是 我 们 去 掉 错误 日 志 的 原因 ; 练习 
8.3 给 出 了 更 好 的 解决 方案 。( 注 意 ，go 语句 调用 一 个 字面 量 函 数 ， 一 个 通用 的 构造 方式 )。 

在 它 返回 前 ， 后 台 goroutine 记录 一 条 消息 ， 然 后 发 送 一 个 值 到 done 通道 。 主 goroutine 
在 退出 前 一 直 等 待 ， 直 到 它 接收 到 这 个 值 。 最 终 效 果 是 程序 总 是 在 退出 前 记录 "done" 消息 。 

通过 通道 发 送 消息 有 两 个 重要 的 方面 需要 考虑 。 每 一 条 消息 有 一 个 值 ， 但 有 时 候 通 信 本 
身 以 及 通信 发 生 的 时 间 也 很 重要 。 当 我 们 强调 这 方面 的 时 候 ， 把 消息 叫 作 事件 (event)。 当 
事件 没有 携带 额外 的 信息 时 ， 它 单纯 的 目的 是 进行 同步 。 我 们 通过 使 用 一 个 struct{} 元 素 类 
型 的 通道 来 强调 它 ， 尽 管 通常 使 用 bool 或 int 类 型 的 通道 来 做 相同 的 事情 ， 因 为 done <-1 比 
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done <- struct{}{} 要 短 。 

练习 8.3 : 在 netcat3 中 ，conn 接口 有 一 个 具体 的 类 型 *net.TCPConn， 它 代表 一 个 TCP 
连接 。TCP 链接 由 两 半边 组 成 ， 可 以 通过 closeRead 和 closewrite 方法 分 别 关 闭 。 修 改 主 
goroutine， 仅 仅 关闭 连接 的 写 半 边 ， 这 样 程序 可 以 继续 执行 来 输出 来 自 reverbl 服务 器 的 回 
声 ， 即 使 标准 输入 已 经 关闭 。( 对 reverbz 程序 来 说 更 难 _ 些 ， 见 练习 8.4 


8.4.2 管道 


通道 可 以 用 来 连接 goroutine， 这 样 一 个 的 输出 是 另 一 个 的 输入 。 这 个 叫 管道 (pipeline)。 
下 面 的 程序 由 三 个 goroutine 组 成 ， 它们 被 两 个 通道 连接 起 来 ， 如 图 8-1 所 示 。 


counter 0 es squarer eld 9 rinter 
e 二 生生 
自然 数 了 求 平方 
图 8-1 一 个 三 级 管道 


第 一 个 goroutine 是 counter， 产 生 一 个 0，1，2，… 的 整数 序列 ， 然 后 通过 一 个 管道 发 
送 给 第 二 个 goroutine ( 叫 square)， 计 算数 值 的 平方 ， 然后 将 结果 通过 另 一 个 通道 发 送 给 第 
三 个 goroutine ( 叫 printer)， 接 收 值 并 输出 它们 。 为 了 简化 例子 ， 我 们 特意 选择 了 非常 简单 
的 函数 ， 尽 管 它们 太 简 单 以 至 于 在 现实 程序 中 不 可 能 有 自己 的 goroutine。 

gopl. io/ch8/pipelinel 


func main() { 





naturals := make(chan int) 
squares := make(chan int) 
// counter 
go func() { 
for x := @; ; x+t+ { 
naturals <- x 
} 
}() 
// squarer 
go func() { 
和 OF 二 
x := <-naturals 
Squares <- x * x 
} 
}() 
// printer (在 主 goroutine 中 ) 
for { 


fmt.Println(<-squares) 
} 
} 


正如 所 期 望 的 那样 ， 程 序 输出 无 限 的 平方 序列 0, 1, 4, 9,，…。 像 这 样 的 管道 出 现在 
长 期 运行 的 服务 器 程序 中 ， 其 中 通道 用 于 在 包含 无 限 循环 的 goroutine 之 间 整 个 生命 周期 中 
的 通信 。 如 果 要 通过 管道 发 送 有 限 的 数字 怎么 办 ? 

如 果 发 送 方 知道 没有 更 多 的 数据 要 发 送 ， 告诉 接收 者 所 在 goroutine 可 以 停止 等 待 是 很 
有 用 的 。 这 可 以 通过 调用 内 置 的 close 函数 来 关闭 通道 ， 


close(naturals) 


在 通道 关闭 后 ， 任 何 后 续 的 发 送 操作 将 会 导致 应 用 崩溃 。 当 关闭 的 通道 被 读 完 (就 是 最 
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后 一 个 发 送 的 值 被 接收 ) 后 ， 所 有 后 续 的 接收 操作 顺畅 进行 ， 只 是 获取 到 的 是 零 值 。 关 闭 
naturals 通道 导致 计算 平方 的 循环 快速 运转 ， 并 将 结果 0 传递 给 printer goroutine。 

没有 一 个 直接 的 方式 来 判断 是 否 通道 已 经 关闭 ， 但 是 这 里 有 接收 操作 的 一 个 变种 ， 它 产 
生 两 个 结果 : 接收 到 的 通道 元 素 ， 以 及 一 个 布尔 值 (通常 称 为 ok)， 它 为 true 的 时 候 代表 接 
收成 功 ，false 表示 当前 的 接收 操作 在 一 个 关闭 的 并 且 读 完 的 通道 上 。 使 用 这 个 特性 ， 可 以 
修改 squarer 的 循环 ， 当 naturals 通道 读 完 以 后 ， 关 闭 squares 通道 。 


// squarer 
go func() { 
for { 
x, ok := <-naturals 
if lok { 
break // 通道 关闭 并 且 读 完 


squares <- x * x 
close(squares) 

}() 

因为 上 面 的 语法 比较 笨拙 ， 而 模式 又 比较 通用 ， 所 以 该 语言 也 提供 了 range 循环 语法 以 在 
通道 上 人 迭代。 这 个 语法 更 方便 接收 在 通道 上 所 有 发 送 的 值 ， 接 收 完 最 后 一 个 值 后 关闭 循环 。 

下 面 的 管道 中 ， 当 counter goroutine 在 100 个 元 素 后 结束 循环 时 ， 它 关闭 naturals 通 
道 ， 导 致 squarer 结束 循环 并 关闭 squares 通道 。( 在 更 复杂 的 程序 中 ， 将 counter 和 squarer 的 
goroutine 的 close 调用 延迟 到 外 层 ， 也 是 可 以 的 。) 最 终 ， 主 goroutine 结束 ， 然 后 程序 退出 。 


gopl. io/ch8/pipeline2 





func main() { 


naturals := make(chan int) 
squares := make(chan int) 
// counter 
go func() { 
for x := 0; x < 1686; x++ { 


naturals <- x 


close(naturals) 


}() 


// squarer 
go func() { 
for x := range naturals { 
squares <- x * x 
} 


close(squares) 


}() 


// printer (在 主 goroutine 中 ) 
for x := range squares { 
fmt.Println(x) 
} 
} 


结束 时 ， 关 闭 每 一 个 通道 不 是 必需 的 。 只 有 在 通知 接收 方 goroutine 所 有 的 数据 都 发 送 
完毕 的 时 候 才 需要 关闭 通道 。 通 道 也 是 可 以 通过 垃圾 回收 器 根据 它 是 否 可 以 访问 来 决定 是 否 
回收 它 ， 而 不 是 根据 它 是 否 关 闭 。( 不 要 将 这 个 close 操作 和 对 于 文件 的 close 操作 混淆 。 当 
结束 的 时 候 对 每 一 个 文件 调用 close 方法 是 非常 重要 的 。) 
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试图 关闭 一 个 已 经 关闭 的 通道 会 导致 宕 机 ， 就 像 关 闭 一 个 空 通道 一 样 。 关 闭 通道 还 可 以 作为 
一 个 广播 机 制 ， 将 在 8.9 节 进 行 讨论 。 


8.4.3 单 向 通道 类 型 
当 程序 演进 时 ， 将 大 的 函数 拆 分 为 多 个 更 小 的 是 很 自然 的 。 上 一 个 例子 使 用 了 三 个 
goroutine， 两 个 通道 用 来 通信 ， 它 们 都 是 main 的 局 部 变量 。 程 序 自然 划分 为 三 个 函数 ; 


func counter(out chan int) 
func squarer(out, in chan int) 
func printer(in chan int) 


squarer 函数 处 于 管道 的 中 间 ， 使 用 两 个 参数 ， 输入 通道 和 输出 通道 。 它 们 有 相同 的 类 
型 ， 但 是 用 途 是 相反 的 : in 仅仅 用 来 接收 ，out 仅仅 用 来 发 送 ，in 和 out 两 个 名 字 是 特意 使 
用 的 , 但 是 没有 什么 东西 阻碍 squarer 函数 通过 in 来 发 送 或 者 通过 out 来 接收 。 

这 是 一 个 典型 的 安排 ， 当 一 个 通道 用 做 函数 的 形 参 时 ， 它 几乎 总 是 被 有 意 地 限制 不 能 发 
送 或 不 能 接收 。 

将 这 种 意图 文档 化 可 以 避免 误 用 ，Go 的 类 型 系统 提供 了 单 向 通道 类 型 ， 仅 仅 导出 发 送 
或 接收 操作 。 类 型 chan<- int 是 一 个 只 能 发 送 的 通道 ， 允 许 发 送 但 不 允许 接收 。 反 之 ， 类 型 
<-chan int 是 一 个 只 能 接收 的 int 类 型 通道 ， 允 许 接 收 但 是 不 能 发 送 。(<- 操作 符 相对 于 chan 
关键 字 的 位 置 是 一 个 帮助 记忆 的 点 )。 违 反 这 个 原则 会 在 编译 时 被 检查 出 来 。 

因为 close 操作 说 明了 通道 上 没有 数据 再 发 送 ， 仅 仅 在 发 送 方 goroutine 上 才能 调用 它 ， 
所 以 试图 关闭 一 个 仅 能 接收 的 通道 在 编译 时 会 报错 。 

这 里 我 们 又 一 次 看 到 平方 管道 ， 这 次 我 们 使 用 单 向 通道 类 型 ; 
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func counter(out chan<- int) { 
for x := 0@; x < 166; x++ { 
Out <- x 


close(out) 


func squarer(out chan<- int, in <-chan int) { 
for v := range in { 
Out <- Vv*y 


close(out) 
func printer(in <-chan int) { 


for v := range in { 
fmt.Println(v) 


上 

} 

func main() { 
naturals := make(chan int) 
squares := make(chan int) 
go counter(naturals) 
go squarer(squares, naturals) 
printer(squares) 

} 


counter(naturals) 的 调用 隐 式 地 将 chan int 类 型 转化 为 参数 要 求 的 chan<- int 类 型 。 调 
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用 printer(squares) 做 了 类 似 <-chan int 的 转变 。 在 任何 赋值 操作 中 将 双向 通道 转换 为 单 向 
通道 都 是 允许 的 ， 但 是 反 过 来 是 不 行 的 ， 一 旦 有 一 个 像 chan<- int 这 样 的 单 向 通道 ， 是 没有 
办 法 通过 它 获 取 到 引用 同一 个 数据 结构 的 chan int 数据 类 型 的 。 


8.4.4 缓冲 通道 


缓冲 通道 有 一 个 元 素 队 列 ， 队 列 的 最 大 长 度 在 创建 的 时 候 通 记 丽 人 胎 友 权 
过 nake 的 容量 参数 来 设置 。 下 面 的 语句 创建 一 个 可 以 容纳 三 个 字 
符 串 的 缓冲 通道 。 图 8-2 展示 了 ch 和 指向 它 的 引用 。 8-2 ”一 个 空 的 缓冲 通道 


ch = make(chan string，3) 


缓冲 通道 上 的 发 送 操作 在 队列 的 尾部 插入 一 个 元 素 ， 接 收 操作 从 队列 的 头 部 移 除 一 个 元 
素 。 如 果 通 道 满 了 ， 发 送 操作 会 阻塞 所 在 的 goroutine 直到 另 一 个 goroutine 对 它 进行 接收 操 
作 来 留 出 可 用 的 空间 。 反 过 来 ， 如 果 通 道 是 空 的 ， 执 行 接收 操作 的 goroutine 阻塞 ， 直 到 另 
一 个 goroutine 在 通道 上 发 送 数据 。 

可 以 在 当前 通道 上 无 阻塞 地 发 送 三 个 值 : 

ch <- "A" 


ch <- "B" 
ch <- "C" 


这 时 ， 通道 是 满 的 ， 如 图 8-3 所 示 ， 第 四 个 发 送 语 句 将 会 阻塞 。 
如 果 接 收 一 个 值 : 


fmt .Println(<-ch) // "A" 


通道 既 不 满 也 不 空 ， 如 图 8-4 所 示 ， 所 以 这 时 一 个 接收 或 发 送 操作 都 不 会 阻塞 。 通 过 这 
个 方式 ， 通 道 的 缓冲 区 将 发 送 和 接收 goroutine 进行 解 耦 。 


ET] 四 加 盘 


图 8-3 一 个 满 的 缓冲 通道 图 8-4 一 个 部 分 填 满 的 缓冲 通道 

不 太 和 常见 的 一 个 情况 是 ， 程 序 需 要 知道 通道 缓冲 区 的 容量 ， 可 以 通过 调用 内 置 的 cap 函 
数 获取 它 : 

fmt .Println(cap(ch)) // "3" 

当 使 用 内 置 的 len 函数 时 ， 可 以 获取 当前 通道 内 的 元 素 个 数 。 因 为 在 并 发 程序 中 这 个 信息 
会 随 着 检索 操作 很 快 过 时 ， 所 以 它 的 价值 很 低 ， 但 是 它 在 错误 诊断 和 性 能 优化 的 时 候 很 有 用 。 

fmt.Println(len(ch)) // "2" 

通过 接 下 去 的 两 次 接收 操作 ， 通 道 又 变 空 了 ， 第 四 次 接收 会 被 阻塞 : 


fmt .println(<-ch) VB 
fmt.Println(<-ch) // "Cc" 


这 个 例子 中 ， 发 送 和 接收 操作 都 由 同一 个 goroutine 执行 ， 但 在 真实 的 程序 中 通常 由 不 同 
的 goroutine 执行 。 因 为 语法 简单 ， 新 手 有 时 候 粗 暴 地 将 缓冲 通道 作为 队列 在 单个 goroutine 中 
使 用 ， 但 是 这 是 个 错误 。 通 道 和 goroutine 的 调度 深度 关联 ， 如 果 没 有 另 一 个 goroutine 从 通 
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道 进行 接收 ， 发 送 者 (也许 是 整个 程序 ) 有 被 永久 阻塞 的 风险 。 如 果 仅 仅 需 要 一 个 简单 的 队 
列 ， 使 用 slice 创建 一 个 就 可 以 。 
下 面 的 例子 展示 一 个 使 用 缓冲 通道 的 应 用 。 它 并 发 地 向 三 个 镜像 地 址 发 请 求 ， 镜 像 指 相 
同 但 分 布 在 不 同 地 理 区 域 的 服务 器 。 它 将 它们 的 响应 通过 一 个 缓冲 通道 进行 发 送 ， 然 后 只 接 
收 第 一 个 返回 的 响应 ， 因 为 它 是 最 早 到 达 的 。 所 以 mirroredQuery 函数 甚至 在 两 个 比较 慢 的 
服务 器 还 没有 响应 之 前 返回 了 一 个 结果 。( 偶 然 情况 下 ， 会 出 现 像 这 个 例子 中 几 个 goroutine 
同时 在 一 个 通道 上 并 发 发 送 ， 或 者 同时 从 一 个 通道 接收 的 情况 。) 
func mirroredQuery() string { 
responses := make(chan string，3) 
go func() { responses <- request("asia.gopl.io") }() 
go func() { responses <- request("europe.gopl.io") }() 
go func() { responses <- request("americas.gopl.io") }() 
return <-responses // return the quickest response 
} 


func request(hostname string) (response string) { /* ... */ } 


如 果 使 用 一 个 无 缓冲 通道 ， 两 个 比较 慢 的 goroutine 将 被 卡 住 ， 因 为 在 它们 发 送 响 应 结 
果 到 通道 的 时 候 没 有 goroutine 来 接收 。 这 个 情况 叫 作 goroutine 泄漏 ， 它 属于 一 个 bug。 不 
像 回 收 变 量 ， 泄 露 的 goroutine 不 会 自动 回收 ， 所 以 确保 goroutine 在 不 再 需要 的 时 候 可 以 自 
动 结束 。 

无 缓冲 和 缓冲 通道 的 选择 、 缓 冲 通道 容量 大 小 的 选择 ， 都 会 对 程序 的 正确 性 产生 影响 
无 缓冲 通道 提供 强 同 步 保障 ， 因 为 每 一 次 发 送 都 需要 和 一 次 对 应 的 接收 同步 ， 对 于 缓冲 通 
道 ， 这 些 操 作 则 是 解 耦 的 。 如 果 我 们 知道 要 发 送 的 值 数量 的 上 限 ， 通 常会 创建 一 个 容量 是 使 
用 上 限 的 缓冲 通道 ， 在 接收 第 一 个 值 前 就 完成 所 有 的 发 送 。 在 内 存 无 法 提供 缓冲 容量 的 情况 
下 ， 可 能 导致 程序 死 锁 。 

通道 的 缓冲 也 可 能 影响 程序 的 性 能 。 想 象 蛋糕 店 里 的 三 个 厨师 ， 在 生产 线 上 ， 在 把 每 一 
个 蛋糕 传递 给 下 一 个 厨师 之 前 ， 一 个 烤 ， 一 个 加 糖衣 ， 一 个 雕刻 。 在 空间 比较 小 的 厨房 ， 每 
一 个 厨师 完成 一 个 蛋糕 流程 ， 必 须 等 待 下 一 个 厨师 准备 好 接受 它 ; 这 个 场景 类 似 于 使 用 无 组 
冲 通道 来 通信 。 

如 果 在 厨师 之 间 有 可 以 放 一 个 蛋糕 的 位 置 ， 一 个 厨师 可 以 将 制作 好 的 蛋糕 放 到 这 里 ， 然 
后 立即 开始 制作 下 一 个 ， 这 类 似 于 使 用 一 个 容量 为 1 的 缓冲 通道 。 只 要 厨师 们 以 相同 的 速度 
工作 ， 大 多 数 工作 就 可 以 快速 处 理 ， 消 除 他 们 各 自 之 间 的 速率 差异 。 如 果 在 厨师 之 间 有 更 多 
的 空间 一 一 更 长 的 缓冲 区 一 一 就 可 以 消除 更 大 的 暂 态 速率 波动 而 不 影响 组 装 流水 线 ， 比 如 当 
一 个 厨师 稍 作 休息 时 ， 后 面 再 抓紧 跟 上 进度 。 

男 一 方面 ， 如 果 生 产 线 的 上 游 持续 比 下 游 快 ， 缓 冲 区 满 的 时 间 占 大 多 数 。 如 果 后 续 的 流 
程 更 快 ， 缓冲 区 通常 是 空 的 。 这 时 缓冲 区 的 存在 是 没有 价值 的 。 

组 装 流 水 线 是 对 于 通道 和 goroutine 合适 的 比喻 。 例 如 ， 如 果 第 二 段 更 加 复杂 ， 一 个 厨 
师 可 能 跟 不 上 第 一 个 厨师 的 供应 ， 或 者 跟 不 上 第 三 个 厨师 的 需求 。 为 了 解决 这 个 问题 ， 我 们 
可 以 雇用 另 一 个 厨师 来 帮助 第 二 段 流程 ， 独 立地 执行 同样 的 任务 。 这 个 类 似 于 创建 另外 一 个 
goroutine 使 用 同一 个 通道 来 通信 。 

这 里 没有 空间 来 展示 细节 ， 但 是 gop1.io/ch8/cake 包 模 拟 蛋 糕 店 ， 并 且 有 几 个 参数 可 以 
调节 。 它 包含 了 上 面 描述 场景 的 一 些 性 能 基准 参照 (参考 11.4 节 )。 
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8.5 ”并 行 循 环 

这 一 节 探 讨 一 些 通用 的 并 行 模式 ， 来 并 行 执行 所 有 的 循环 迭代 。 考 虑 生成 一 批 全 尺寸 
图 像 的 缩 略 图 的 问题 。gopl.io/ch8/thumbnail 包 提 供 ImageFile 函数 ， 它 可 以 缩放 单个 图 像 。 
这 里 不 展示 它 的 实现 细节 ， 它 可 以 从 gopl.io 进行 下 载 。 


gopl.io/ch8/thumbnail 





package thumbnail 


// ImageFile 从 infile 中 读 取 一 幅 图 像 并 把 它 的 缩 略 图 写 入 同一 个 目录 中 
// 它 返 回 生成 的 文件 名 ， 比 如 "foo.thumb.jpg". 
func ImageFile(infile string) (string，error) 


下 面 的 程序 在 一 个 图 像 文件 名 字 列表 上 进行 循环 ， 然 后 给 每 一 个 图 像 产生 一 幅 缩 略 图 : 
gopl1.io/ch8/thumbnail 
// makeThumbnails 生成 指定 文件 的 缩 略 图 
func makeThumbnails(filenames []string) { 
for ，f := range filenames { 
if _, err := thumbnail.ImageFile(f); err != nil { 
log.Println(err) 





} 
} 
} 


很 明显 ， 处 理 文件 的 顺序 没有 关系 ， 因 为 每 一 个 缩放 操作 和 其 他 的 操作 独立 。 像 这 样 由 
-此 完全 独立 的 子 问题 组 成 的 问题 称 为 高 度 并 行 。 高 度 并 行 的 问题 是 最 容易 实现 并 行 的 ， 有 
许多 并 行 机 制 来 实现 线性 扩展 。 
并 行 执行 这 些 操作 ， 忽 略 文件 IO 的 延迟 和 对 同一 文件 使 用 多 个 CPU 进行 图 像 slice 计 
算 。 第 一 个 并 行 版 本 准备 仅仅 添加 go 关键 字 。 现 在 将 忽略 错误 ， 后 面 再 处 理 : 


// 注意 : 不 正确 
func makeThumbnails2(filenames []string) { 
for ，f := range filenames { 
go thumbnail.ImageFile(f) // 注意 : 忽略 错误 
} 
} 


这 一 版 运行 真得 太 快 了 ， 事实 上 ， 即 使 在 文件 名 称 slice 中 只 有 一 个 元 素 的 情况 下 ， 它 
也 比 原始 版 本 要 快 。 如 果 这 里 没有 并 行 机 制 ， 并 发 的 版 本 怎么 可 能 运行 得 更 快 ? 答案 是 
makeThumbnails2 在 没有 完成 想 要 完成 的 事情 之 前 就 返回 了 。 它 启动 了 所 有 的 goroutine， 每 
个 文件 一 个 ， 但 是 没有 等 它们 执行 完毕 。 

没有 一 个 直接 的 访问 等 待 goroutine 结束 ， 但 是 可 以 修改 内 层 goroutine， 通 过 一 个 共 
享 的 通道 发 送 事件 来 向 外 层 goroutine 报告 它 的 完成 。 因 为 我 们 知道 len(filenames) 内 层 
goroutine 的 确切 个 数 ， 所 以 外 层 goroutine 只 需要 在 返回 前 对 完成 事件 进行 计数 : 


// makeThumbnails3 并 行 生成 指定 文件 的 缩 略 图 
func makeThumbnails3(filenames []string) { 
ch := make(chan struct{}) 
for ，f := range filenames { 
go func(f string) { 
thumbnail.ImageFile(f) // 注意 : 此 处 忽略 了 可 能 的 错误 
ch <- struct{}{} 
}(f) 
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// 等 待 goroutine 完成 
for range filenames { 


<-ch 
} 
意 ， 这 里 作为 一 个 字面 量 函 数 的 显 式 参数 传递 f， 而 不 是 在 for 循环 中 声明 f; 
for _, f := range filenames { 
go func() { 
thumbnail.ImageFile(f) // 注意 : 不 正确 
A wes 
}() 
} 


回想 5.6.1 节 描 述 的 在 内 部 匿名 函数 中 获取 循环 变量 的 问题 。 上 面 单 变量 f 的 值 被 所 有 
的 匿名 函数 值 共享 并 且 被 后 续 的 迭代 所 更 新 。 这 时 新 的 goroutine 执行 字面 量 函 数 ，for 循环 
可 能 已 经 更 新 f， 并 且 开 始 另 一 一 个 迭代 或 者 已 经 完全 结束 ， 所 以 当 这 些 goroutine 读 取 f 的 值 
时 ， 它 们 所 看 到 的 都 是 slice 的 最 后 一 个 元 素 。 通 过 添加 显 式 参数 ， 可 以 确保 当 go 语句 执行 
的 时 候 ， 使 用 f 的 当前 值 。 

我 们 想 让 每 一 个 工作 goroutine 中 向 主 goroutine 返回 什么 ? 如 果 调 用 thumbnail. 
ImageFile 无 法 创建 一 个 文件 ， 它 返回 一 个 错误 。 下 一 个 版 本 的 makeThumbnails 返回 第 一 个 它 
从 扩展 的 操作 中 接收 到 的 错误 : 

// makeThumbnails4 为 指定 文件 并 行 地 生成 缩 略 图 

// 如 果 任 何 步骤 出 错 它 返 回 一 个 错误 


func makeThumbnails4(filenames []string) error { 
errors := make(chan error) 


for _, f := range filenames { 
go func(f string) { 
_，err := thumbnail.ImageFile(f) 
errors <- err 


}(f) 


for range filenames { 
if err := <-errors; err != nil { 
return err // 注意 : 不 正确 ，goroutine 泄漏 


} 


return nil 


上 


这 个 函数 有 一 个 微妙 的 缺陷 ， 当 遇 到 第 一 个 非 nil 的 错误 时 ， 它 将 错误 返回 给 调用 
者 ， 这 样 没有 goroutine 继续 从 errors 返回 通道 上 进行 接收 ， 直 至 读 完 。 每 一 个 现存 的 工 
作 goroutine 在 试图 发 送 值 到 此 通道 的 时 候 永 久 阻塞 ， 永 不 终止 。 这 种 情况 下 goroutine 泄漏 
(参考 8.4.4 节 ) 可 能 导致 整个 程序 卡 住 或 者 系统 内 存 耗 尽 。 
”最 简单 的 方案 是 使 用 一 个 有 足够 容量 的 缓冲 通道 ， 这 样 没 有 工作 goroutine 在 发 送 消息 
时 候 阻 塞 。( 另 一 个 方案 是 在 主 goroutine 返回 第 一 个 错误 的 同时 ， 创 建 另 一 个 goroutine 来 
读 完 通道 。) 

下 一 个 版 本 的 makeThumbnails 使 用 一 个 缓冲 通道 来 返回 生成 的 图 像 文 件 的 名 称 以 及 任何 
错误 消息 : 
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// makeThumbnails5 为 指定 文件 并 行 地 生成 缩 略 图 
// 它 以 任意 顺序 返回 生成 的 文件 名 
// 如 果 任 何 步骤 出 错 就 返回 一 个 错误 
func makeThumbnails5(filenames []string) (thumbfiles []string, err error) { 
type item struct { 
thumbfile string 
err error 


ch := make(chan item, len(filenames)) 
for ，f := range filenames { 
go func(f string) { 
var it item 
it.thumbfile, it.err = thumbnail.ImageFile(f) 
ch <- it 


}(f) 


for range filenames { 
it := <-ch 
if it.err != nil { 
return nil, it.err 


thumbfiles = append(thumbfiles, it.thumbfile) 
} 


return thumbfiles, nil 


} 


makeThumbnails 的 终极 版 本 (参见 下 面 ) 返回 新 文件 所 占用 的 总 字 节 数 。 不 像 前 一 个 版 
本 ， 它 不 是 使 用 slice 接收 文件 名 ， 而 是 借助 一 个 字符 串通 道 ， 这 样 我 们 不 能 预测 迭代 的 
次 数 。 

为 了 知道 什么 时 候 最 后 一 个 goroutine 结束 ( 它 不 一 定 是 最 后 启动 的 )， 需 要 在 每 一 个 
goroutine 启动 前 递增 计数 ， 在 每 一 个 goroutine 结束 时 递减 计数 。 这 需要 一 个 特殊 类 型 的 计 
数 器 ， 它 可 以 被 多 个 goroutine 安全 地 操作 ， 然 后 有 一 个 方法 一 直 等 到 它 变 为 0。 这 个 计数 
器 类 型 是 sync.waitGroup， 下 面 的 代码 展示 如 何 使 用 它 : 


// makeThumbnails6 为 从 通道 接收 到 的 每 个 文件 生成 缩 略图 
// 它 返 回 其 生成 的 文件 占用 的 字 节 数 
func makeThumbnails6(filenames <-chan string) int64 { 
sizes := make(chan int64) 
var wg sync.WaitGroup // 工作 goroutine 的 个 数 
for f := range filenames { 
wg.Add(1) 
// worker 
go func(f string) { 
defer wg.Done() 
thumb, err := thumbnail.ImageFile(f) 
if err != nil { 
log.Println(err) 
return 
} 
info，_ := os.Stat(thumb) // 可 以 忽略 错误 
sizes <- info.Size() 


}(f) 


和 伪 8 茧 
一 第 8 六 


// closer 

go func() { 
wg.Wait() 
close(sizes) 


}0) 


var total int64 
for size := range sizes { 
total += size 


return total 


} 

注意 Add 和 Done 方法 的 不 对 称 性 。add 递增 计数 器 ， 它 必须 在 工作 goroutine 开始 之 前 执 
行 ， 而 不 是 在 中 间 。 另 一 方面 ， 不 能 保证 Add 会 在 关闭 者 goroutine 调用 wait 之 前 发 生 。 另 
外 ，Add 有 一 个 参数 ， 但 pone 没有 ， 它 等 价 于 Add(-1)。 使 用 defer 来 确保 在 发 送 错误 的 情况 
下 计数 器 可 以 递 减 。 在 不 知道 迭代 次 数 的 情况 下 ， 上 面 的 代码 结构 是 通用 的 符合 习惯 的 并 
行 循 环 模式 。 

sizes 通道 将 每 一 个 文件 的 大 小 带 回 主 goroutine， 它 使 用 range 循环 进行 接收 然后 计算 
总 和 。 注 意 ， 在 关闭 者 goroutine 中 ， 在 关闭 sizes 通道 之 前 ， 等 待 所 有 的 工作 者 结束 。 这 
里 两 个 操作 (等 待 和 关闭 ) 必须 和 在 sizes 通道 上 面 的 迭代 并 行 执行 。 考虑 替代 方案 : 如 果 
我 们 将 等 待 操作 放 在 循环 之 前 的 主 goroutine 中 ， 因 为 通道 会 满 ， 它 将 永 不 结束 ; 如 果 放 在 
循环 后 面 ， 它 将 不 可 达 ， 因 为 没有 任何 东西 可 用 来 关闭 通道 ， 循环 可 能 永 不 结 

图 8-5 说 明 makeThumbnails6 函数 中 的 事件 序列 。 垂 直线 表示 goroutine。 细 片段 表示 休眠 ， 
粗 片 段 表 示 活 动 。 斜 箭头 表示 goroutine 通过 事件 进行 了 同步 。 时 间 从 上 向 下 流动 。 注 意 ， 主 
goroutine 把 大 多 数 时 间 花 在 range 循环 休眠 上 ， 等 待 工作 者 发 送 值 或 等 待 closer 来 关闭 通道 。 


main 


8o 
&0 worker 
Ea closer 





图 8-5 makeThumbnails6 中 的 事件 序列 


练习 8.4: 修改 reverb2 程序 来 使 用 sync.waitGroup 来 计算 每 一 个 连接 上 面 的 活动 的 回声 
goroutine 的 个 数 。 当 它 变 成 0 时， 关闭 练习 8.3 中 描述 的 写 半 边 的 TCP 链接 。 验证 你 修改 
好 的 netcat3 客户 端 ， 等 待 最 后 几 个 并 发 的 呼喊 回声 ， 即使 标准 输入 已 经 关闭 。 

练习 8.5 : 使 用 一 个 已 有 的 CPU 绑 定 的 顺序 程序 ， 例 如 3.3 节 的 Mandelbrot 程序 ， 或 者 
3.2 节 的 3D 平面 计算 ， 在 主 循环 中 并 行 执行 它们 ， 使 用 通道 来 通信 。 在 多 CPU 的 机 器 上 它 
的 运行 速度 有 多 快 ? goroutine 的 最 优 数量 是 多 少 ? 
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8.6 示例 : 并 发 的 Web 疏 虫 


在 5.6 节 中 ,我们 制作 了 一 个 简单 的 网 页 息 虫 ， 它 以 广度 优先 的 顺序 来 探索 网 页 的 链接 
图 。 这 一 节 中 ， 我 们 使 它 可 并 发 运行 ， 这 样 对 crawl 的 独立 调用 可 以 充分 利用 Web 上 的 IO 
并 行 机 制 。crawl 函数 依然 在 gop1.io/ch5/findlinks3 中 : 


gopl1.io/ch8/crawl1 
func crawl(url string) []string { 
fmt.Println(url) 
list, err := links.Extract(url) 
if err l= nil { 
log.Print(err) 


return list 


} 

main 函数 类 似 于 breadthFirst (参考 5.6 节 )。 像 前 面 那样 ， 一 个 任务 列表 记录 需要 处 理 的 
条 目 队 列 ， 每 一 个 条 目 是 一 个 待 候 取 的 URL 列表 ， 这 次 我 们 使 用 通道 代替 slice 来 表示 队列 。 
每 一 次 对 crawl 的 调用 发 生 在 它 自己 的 goroutine 中 ， 然 后 将 发 现 的 链接 发 送 回 任务 列表 : 


func main() { 
worklist := make(chan []string) 


// 从 命令 行 参 数 开始 
go func() { worklist <- os.Args[1:] }() 


// 并 发 展 取 Web 

seen := make(map[string]jbool) 

for list := range worklist { 

for _, link := range list { 
if !seen[link] { 
seen[link] = true 
go func(link string) { 
worklist <- crawl(link) 

}(link) 


} 
} 


注意 ， 该 候 取 goroutine 将 link 作为 显 式 参数 来 使 用 ， 以 避免 5.6.1 节 第 一 次 看 到 的 循 
环 变量 捕获 的 问题 。 也 要 注意 ， 发 送 给 任务 列表 的 命令 行 参数 必须 在 它 自己 的 goroutine 中 
运行 来 避免 死 锁 ， 死 锁 是 一 种 卡 住 的 情况 ， 其 中 主 goroutine 和 一 个 疏 取 goroutine 同时 发 送 
给 对 方 但 是 双方 都 没有 接收 。 另 一 个 可 选 的 方案 是 使 用 缓冲 通道 。 

这 个 疏 虫 高 度 并 发 ， 输 出 巨 量 的 URL。 但 是 它 有 两 个 问题 ， 第 一 个 问题 是 在 执行 若干 
秒 后 ， 它 自己 出 现 错误 日 志 : 

$ go build gop1.io/ch8/crawl1 

$ ./crawll http://gopl.io/ 

http://gopl.io/ 

https://golang.org/help/ 


https://golang.org/doc/ 
https://golang.org/blog/ 


2615/67/15 18:22:12 Get ...: dial tcp: lookup blog.golang.org: no such host 
2615/67/15 18:22:12 Get ...: dial tcp 23.21.222.120:443: socket: 
too many open files 
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第 一 条 消息 比较 令 人 意外 ， 因 为 它 报 告 的 是 对 一 个 可 靠 的 域名 出 现 了 解析 失败 。 接 下 去 
的 错误 消息 说 明 程 序 同时 创建 了 太 多 的 网 络 连 接 ， 超 过 了 程序 能 打开 文件 数 的 限制 ， 导 致 类 
似 于 DNS 查询 和 net.pial 的 连接 失败 。 

程序 的 并 行 度 太 高 了 ， 无 限制 的 并 行 通常 不 是 一 个 好 的 主意 ， 因 为 系统 中 总 有 限制 因 
素 ， 例如， 对 于 计算 型 应 用 CPU 的 核 数 ， 对 于 磁盘 IO 操作 磁头 和 磁盘 的 个 数 ， 下 载 流 所 
使 用 的 网 络 带宽 ， 或 者 Web 服务 本 身 的 容量 。 解 决 方法 是 根据 资源 可 用 情况 限制 并 发 的 个 
数 ， 以 匹配 合适 的 并 行 度 。 该 例子 中 有 一 个 简单 的 办 法 是 确保 对 于 links.Extract 的 同时 调 
用 不 超过 个 ， 即 比 文件 描述 符 所 规定 的 20 个 少 得 多 。 这 种 方式 类 似 于 一 个 拥挤 夜店 的 门 
卫 只 有 在 有 客人 离开 的 时 候 才 允许 其 他 客人 进去 。 

我 们 可 以 使 用 容量 为 n 的 缓冲 通道 来 建立 一 个 并 发 原 语 ， 称 为 计数 信号 量 。 概 念 上 ， 对 
于 缓冲 通道 中 的 个 空闲 槽 ， 每 一 个 代表 一 个 令 牌 ， 持 有 者 可 以 执行 。 通 过 发 送 一 个 值 到 通 
道中 来 领取 令 牌 ， 从 通道 中 接收 一 个 值 来 释放 令 牌 ， 创 建 一 个 新 的 空闲 槽 。 这 保证 了 在 没有 
接收 操作 的 时 候 ， 最 多 同时 有 个 发 送 。( 尽 管 使 用 已 填充 模 比 令 牌 更 直观 ， 但 使 用 空闲 覃 
在 创建 通道 缓冲 区 之 后 可 以 省 掉 填 充 的 过 程 。) 因为 通道 的 元 素 类 型 在 这 里 不 重要 ， 所 以 我 
们 使 用 struct{}， 它 所 占用 的 空间 大 小 是 0。 

重 写 crawl 函数 ， 使 用 令 牌 的 获取 和 释放 操作 来 包括 对 links.Extract 函数 的 调用 ， 这 样 
保证 最 多 同时 20 个 调用 可 以 进行 。 保 持 信 号 量 操作 离 它 所 约束 的 IO 操作 越 近 越 好 一 一 这 
是 一 个 好 的 实践 : 

gopl1.io/ch8/crawl2 
// 令 牌 是 一 个 计数 信号 量 
// 确保 并 发 请 求 限制 在 26 个 以 内 


var tokens = make(chan struct{}，26) 


func crawl(url string) []string { 
fmt.Println(url) 
tokens <- struct{}{} // 获取 令 牌 
list, err := links.Extract(url) 
<-tokens // 释放 令 牌 
if err != nil { 
log.Print(err) 


return list 


} 


第 二 个 问题 是 这 个 程序 永远 不 会 结束 ， 即 使 它 已 经 从 初始 URL 发 现 了 所 有 的 可 达 链 接 ( 当 
然 ， 你 可 能 注意 不 到 这 个 问题 ， 除 非 你 精心 选择 初始 URL 或 者 像 练习 8.6 一 样 使 用 深度 限制 
策略 )。 为 了 让 程序 终止 ， 当 任务 列表 为 空 是 仆 取 goroutine 都 结束 以 后 ， 需要 从 主 循环 退出 : 


func main() { 
worklist := make(chan []string) 


Var n int // 等 待 发 送 到 任务 列表 的 数量 
// 从 命令 行 参 数 开 始 


n+ 十 
go func() { worklist <- os.Args[1:] }() 


// 并 发 展 取 Web 
seen := make(map[string]bool) 
for yn>6in--{ 

list := <-worklist 
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for _, link := range list { 
if !seen[link] { 
seen[link] = true 
n++ 
go func(link string) { 
worklist <- crawl(link) 
}(link) 
} 
} 
} 


这 个 版 本 中 ,计数器 n 跟踪 发 送 到 任务 列表 中 的 任务 个 数 。 每 次 知道 一 个 条 目 被 发 送 到 
任务 列表 时 ， 就 递增 变量 n， 第 一 次 递增 是 在 发 送 初始 化 命令 行 参 数 之 前 ， 第 二 次 递增 是 在 
每 次 启动 一 个 新 的 胞 取 goroutine 的 时 候 。 主 循环 从 n 减 到 0， 这 时 再 没有 任务 需要 完成 。 

现在 ， 并 发 伏 虫 的 速度 大 约 比 5.6 节 中 广度 优先 版 本 快 20 倍 ， 在 它 完成 任务 的 时 候 ， 
应 该 没有 错误 出 现 ， 并 且 正 确 退出 。 

下 面 的 程序 展示 一 个 替代 方案 ， 解 决 过 度 并 发 的 问题 。 这 个 版 本 使 用 最 初 的 crawl 限 
数 ， 它 没有 计数 信号 量 ， 但 是 通过 20 个 长 期 存活 的 候 虫 goroutine 来 调用 它 ， 这 样 确保 最 多 
20 个 HTTP 请 求 并 发 执行 : 


gopl. io/ch8/crawl3 
func main() { 
worklist := make(chan []string) // 可 能 有 重复 的 URL 列表 
unseenLinks := make(chan string) // 去 重 后 的 URL 列表 
// 向 任务 列表 中 添加 命令 行 参数 
go func() { worklist <- os.Args[1:] }() 


// 创建 26 个 爬虫 goroutine 来 获取 每 个 不 可 见 链接 
for i := 0; i < 26; i++{ 
go func() { 
for link := range unseenLinks { 
foundLinks := crawl(link) 
go func() { worklist <- foundLinks }() 
} 
$0) 
} 


// 主 goroutine 对 URL 列表 进行 去 重 
// 并 把 没有 爬 取 过 的 条 目 发 送 给 爬虫 程序 
seen := make(map[string]bool) 
for list := range worklist { 
for _, link := range list { 
if lseen[link] { 
seen[link] = true 
unseenLinks <- link 
} 
} 
} 


谍 取 goroutine 使 用 同一 个 通道 unseenLinks 进行 接收 。 主 goroutine 负责 对 从 任务 列表 
接收 到 的 条 目 进行 去 重 ， 然 后 发 送 每 一 个 没有 疏 取 过 的 条 目 到 unseenLinks 通道 ， 然 后 被 候 
取 goroutine 接收 。 

seen map 被 限制 在 主 goroutine 里 面 ， 它 仅仅 需要 被 这 个 goroutine 访问 。 与 其 他 形式 的 
信息 隐藏 一 样 ， 范 围 限 制 可 以 帮助 我 们 推导 程序 的 正确 性 。 例 如 ， 局 部 变量 不 能 在 声明 它 的 
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图 数 之 外 通过 名 字 引 用 ; 没有 从 函数 中 逃逸 ( 见 2.3.4 节 ) 的 变量 不 能 从 函数 外 面 访问 ;一 
个 对 象 的 封装 域 只 能 被 对 象 自己 的 方法 访问 。 所 有 的 场景 中 ， 信 息 隐藏 帮助 限制 程序 不 同 部 
分 之 间 不 经 意 的 交互 。 

crawl 发 现 的 链接 通过 精心 设计 的 goroutine 发 送 到 任务 列表 来 避免 死 锁 。 

为 了 节省 空间 ， 不 在 这 里 讨论 这 个 例子 中 的 终止 问题 。 

练习 8.6 : 对 并 发 爬虫 添加 深度 限制 。 如 果 用 户 设置 -depth=3， 那 么 仅 最 多 通过 三 个 链 
接 可 达 的 URL 能 被 找到 。 

练习 8.7 : 写 一 个 并 发 程序 来 创建 一 个 网 站 的 本 地 镜像 ， 获 取 它 每 一 个 可 达 的 页 面 ， 然 
后 将 它们 写 到 本 地 磁盘 上 的 目录 。 只 能 获取 本 域 的 页 面 (例如 ，golang.org)。 镜 像 页 面 内 的 
URL 按 需 调整 ， 因 为 它们 应 该 引用 镜像 页 面 ， 而 不 是 原始 页 面 。 


8.7 使 用 select 多 路 复 用 


下 面 的 程序 对 火箭 发 射 进行 倒计时 。time.Tick 函数 返回 一 个 通道 ， 它 定期 发 送 事件 ， 
像 一 个 节拍 器 一 样 。 每 个 事件 的 值 是 一 个 时 间 截 ， 但 我 们 更 感 兴趣 它 能 带 来 的 东西 


gopl. io/ch8/countdown1 





func main() { 
fmt.Println("Commencing countdown.") 
tick := time.Tick(1 * time.Second) 


for countdown := 16; countdown > 86; countdown-- { 
fmt.Println(countdown) 
<-tick 

四 

launch() 


让 我 们 通过 在 倒计时 进行 时 按 下 回 车 键 来 取消 发 射 过 程 的 能 力 。 第 一 步 ， 启 动 一 个 
goroutine 试图 从 标准 输入 中 读 取 一 个 字符 ， 如 果 成 功 ， 发 送 一 个 值 到 abort 通道 : 
gopl1.io/ch8/countdown2 
abort := make(chan struct{}) 
go func() { 
os.Stdin.Read(make([]byte，1)) // 读 取 单个 字 节 


abort <- struct{}{} 
}() 


现在 每 一 次 倒计时 迭代 需要 等 待 事件 到 达 两 个 通道 中 的 一 个 ; 计时 器 通道 ， 前 提 是 一 切 
顺利 (nominal) ; 或 者 中 止 事件 前 提 是 有 “异常 ”(anomaly)。 不 能 只 从 一 个 通道 上 接收 ， 因 
为 哪 一 个 操作 都 会 在 完成 前 阻塞 。 所 以 需要 多 路 复 用 那些 操作 过 程 ， 为 了 实现 这 个 目的 ， 需 
要 一 个 select 语句 : 


select { 
case <-chil: 
A as 
case x := <-ch2: 
Ho alse Xess 
case ch3 <- y: 
yy 
default: 
Va 





小 
上 面 展示 的 是 select 语句 的 通用 形式 。 像 switch 语句 一 样 ， 它 有 一 系列 的 情况 和 一 个 
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可 选 的 默认 分 支 。 每 一 个 情况 指定 一 次 通信 (在 一 些 通道 上 进行 发 送 或 接收 操作 ) 和 关联 的 
_ 段 代码 块 。 接 收 表达 式 操作 可 能 出 现在 它 本 身上 ， 像 第 一 个 情况 ， 或 者 在 一 个 短 变量 声明 
中 ， 像 第 二 个 情况 ; 第 二 种 形式 可 以 让 你 引用 所 接收 的 值 。 

select 一 直 等 待 ， 直 到 一 次 通信 来 告知 有 一 些 情况 可 以 执行 。 然 后 ， 它 进行 这 次 通信 ， 
执行 此 情况 所 对 应 的 语句 ; 其 他 的 通信 将 不 会 发 生 。 对 于 没有 对 应 情况 的 select，select{} 
将 永远 等 待 。 

让 我 们 回 到 火箭 发 射程 序 。time.After 函数 立即 返回 一 个 通道 ， 然 后 启动 一 个 新 的 
goroutine 在 间隔 指定 时 间 后 ， 发 送 一 个 值 到 它 上 面 。 下 面 的 select 语句 等 两 个 事件 中 第 一 个 
到 达 的 事件 ， 中 止 事件 或 者 指示 事件 过 去 10s 的 事件 。 如 果 过 了 10s 没有 中 止 ， 开 始 发 射 : 

func main() { 

// .…. 创 建 中 止 通道 ... 


fmt.Println("Commencing countdown. Press return to abort.") 
select { 
case <-time.After(10 * time.Second): 
// 不 执行 任何 操作 
case <-abort: 
fmt.Println("Launch aborted!") 
return 


} 
launch() 

} 

下 面 的 例子 更 微妙 一 些 。 通 道 ch 的 缓冲 区 大 小 为 1， 它 要 么 是 空 的 ， 要 么 是 满 的 ， 因 
此 只 有 在 其 中 一 个 状况 下 可 以 执行 ， 要么 在 i 是 偶数 时 发 送 ， 要 么 在 i 是 奇数 时 接收 。 它 总 
是 输出 。 2 4 6 8: 

ch := make(chan int，1) 

for i := ;ji 16; i++ 

Select { 
case x := <-ch: 

fmt.println(x) // "6" "2" "4" "6" "8" 
case ch <- i: 


} 
} 


如 果 多 个 情况 同时 满足 ，select 随机 选择 一 个 ， 这 样 保证 每 一 个 通道 有 相同 的 机 会 被 选 
中 。 在 前 一 个 例子 中 增加 缓冲 区 的 容量 ， 会 使 输出 变 得 不 可 确定 ， 因为 当 缓 冲 既 不 空 也 不 满 
的 情况 ， 相 当 于 select 语句 在 扔 硬币 做 选择 。 

让 该 发 射程 序 输 出 倒计时 。 下 面 的 select 语句 使 每 一 次 迭代 使 用 1s 来 等 竺 中止， 但 不 
会 更 长 : 


gopl.io/ch8/countdown3 





func main() 


{ 
// .…. 创 建 中 止 通 道 ... 


fmt.Println("Commencing countdown. Press return to abort.") 
tick := time.Tick(1 * time.Second) 
for countdown := 16; countdown > 8; countdown-- { 

fmt .Println(countdown) 

select { 

case <-tick: 


// 什么 操作 也 不 执行 
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Case <-abort: 
fmt.Println("Launch aborted!") 
return 


} 


} 
launch() 


time.Tick 消 数 的 行为 很 像 创建 一 个 goroutine 在 循环 里 面 调 用 time.sleep， 然 后 在 它 
每 次 醒 来 时 发 送 事 件 。 当 上 面 的 倒计时 函数 返回 时 ， 它 停止 从 tick 通道 中 接收 事件 ， 但 是 
计时 器 goroutine 还 在 运行 ， 徒 劳 地 向 一 个 没有 goroutine 在 接收 的 通道 不 断 发 送 一 一 发 生 
goroutine 泄漏 (参考 8.4.4 节 )。 

Tick 函数 很 方便 使 用 ,但 是 它 仅 仅 在 应 用 的 整个 生命 周期 中 都 需要 时 才 合 适 。 否 则 ， 我 
们 需要 使 用 这 个 模式 : 


ticker := time.NewTicker(1 * time.Second) 


<-ticker.C // 从 ticker 的 通道 接收 
ticker.Stop() // 造成 ticker 的 goroutine 终止 


有 时 候 我 们 试图 在 一 个 通道 上 发 送 或 接收 ,但 是 不 想 在 通道 没有 准备 好 的 情况 下 被 阻 
塞 一 一 非 阻 塞 通信 。 这 使 用 select 语 句 也 可 以 做 到 。select 可 以 有 一 个 默认 情况 ， 它 用 来 指 
定 在 没有 其 他 的 通信 发 生 时 可 以 立即 执行 的 动作 。 

下 面 的 select 语句 从 尝试 从 abort 通道 中 接收 一 个 值 ， 如 果 没 有 值 ， 它 什么 也 不 做 。 这 
是 一 个 非 阻塞 的 接收 操作 ;重复 这 个 动作 称 为 对 通道 轮 询 : 


select { 

Case <-abort: 
fmt.Printf("Launch aborted!\n") 
return 

default: 
// 不 执行 任何 操作 


通道 的 零 值 是 nil。 令 人 惊讶 的 是 ，nil 通道 有 时 候 很 有 用 。 因 为 在 nil 通道 上 发 送 和 接 
收 将 永远 阻塞 ， 对 于 select 语句 中 的 情况 ， 如 果 其 通道 是 nil， 它 将 永远 不 会 被 选择 。 这 次 
让 我 们 用 nil 来 开启 或 禁用 特性 所 对 应 的 情况 ， 比 如 超时 处 理 或 者 取消 操作 ， 响应 其 他 的 输 
和 事件 或 者 发 送 事件 。 我 们 将 在 下 一 节 看 到 这 个 例子 。 

练习 8.8 : 使 用 select 语句 ， 给 8.3 节 的 回声 服务 器 加 一 个 超时 ， 这 样 可 以 断 开 10s 内 
没有 任何 呼叫 的 客户 端 。 


8.8 示例 : 并 发 目录 遍历 


这 一 节 中 ， 我们 构建 一 个 程序 ， 根 据 命令 行 指定 的 输入 ， 报 告 一 个 或 多 个 目录 的 磁盘 使 
用 情况 ， 类 似 于 UNIX du 命令 。 大 多 数 的 工作 由 下 面 的 walkpir 函数 完成 ， 它 使 用 dirents 
辅助 函数 来 枚 举目 录 中 的 条 目 。 
gopl.io/ch8/du1 
// wakjDir 递归 地 换 历 以 dir 为 根 目 录 的 整个 文件 树 


// 并 在 filesizes 上 发 送 每 个 已 找到 的 文件 的 大 小 
func walkDir(dir string, filesizes chan<- int64) { 
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for _, entry := range dirents(dir) { 
if entry.IsDir() { 
subdir := filepath.Join(dir, entry.Name()) 
walkDir(subdir, fileSizes) 
} else { 
fileSizes <- entry.Size() 
上 
让 
} 


// dirents 返回 dir 目录 中 的 条 目 
func dirents(dir string) []os.FileInfo { 
entries, err := ioutil.ReadDir(dir) 
if err != nil { 
fmt.Fprintf(os.Stderr， "dul: %v\n", err) 
“ return nil 


return entries 


} 

ioutil.ReadDir 函数 返回 一 个 os.FileInfo 类 型 的 slice， 针 对 单个 文件 同样 的 信息 可 以 通 
过 调用 os.stat 函数 来 返回 。 对 每 一 个 子 目 录 ，walkpir 递归 调用 它 自 己 ， 对 于 每 一 个 文件 ， 
walkDir 发 送 一 条 消息 到 filesizes 通道 。 消 息 是 文件 所 占用 的 字 节 数 。 

如 下 所 示 ，main 函数 使 用 两 个 goroutine。 后 台 goroutine 调用 walkpir 遍历 命令 行 上 指 
定 的 每 一 个 目录 ， 最 后 关闭 filesizes 通道 。 主 goroutine 计算 从 通道 中 接收 的 文件 的 大 小 的 


// dul 计算 目录 中 文件 占用 的 磁盘 空间 大 小 


package main 


import ( 
"flag" 
"fmt" 
"io/ioutil" 
"os" 
"path/filepath" 
) 


func main() { 
// 确定 初始 目录 
flag.Parse() 
roots := flag.Args() 
if len(roots) == 0 { 
roots = [J]string{"."} 


} 

// 遍历 文件 树 

fileSizes := make(chan int64) 

go func() { 
for _, root := range roots { 

walkDir(root, fileSizes) 

close(fileSizes) 

}() 

// 输出 结果 

var nfiles, nbytes int64 

for size := range fileSizes { 
nfiles++ 


nbytes += size 


} 
printDiskUsage(nfiles, nbytes) 
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func printDiskUsage(nfiles, nbytes int64) { 
fmt.Printf("%d files %.1f GB\n", nfiles, float64(nbytes)/1e9) 
} 


在 输出 结果 前 ， 程 序 等 待 较 长 时 间 : 


$ go build gopl.io/ch8/dul 
$ ./dul $HOME /usr /bin /etc 
213281 files 62.7 GB 


如 果 程 序 可 以 通知 它 的 进度 ， 将 会 更 友好 。 但 是 仅 把 printpiskusage 调用 移动 到 循环 内 
部 会 使 它 输出 数 千 行 结果 。 

下 面 这 个 du 的 变种 周期 性 地 输出 总 数 ， 只 有 在 -v 标识 指定 的 时 候 才 输出 ， 因 为 不 是 所 
有 的 用 户 都 想 看 进度 消息 。 后 台 goroutine 依然 从 根部 开始 迭代 。 主 goroutine 现在 使 用 一 个 
计时 器 每 500ms 定期 产生 事件 ， 使 用 一 个 select 语句 或 者 等 待 一 个 关于 文件 大 小 的 消息 ， 这 
时 它 更 新 总 数 ， 或 者 等 待 一 个 计时 事件 ， 这 时 它 输出 当前 的 总 数 。 如 果 -v 标识 没有 指定 ， 
tick 通道 依然 是 nil， 它 对 应 的 情况 在 select 中 实际 上 被 禁用 。 


gopl. io/ch8/du2 
var verbose = flag.Bool("v", false, "show verbose progress messages") 


func main() { 
// ... 启 动 后 台 goroutine... 


// 定期 输出 结果 
var tick <-chan time.Time 
if *verbose { 
tick = time.Tick(566 * time.Millisecond) 
} 
var nfiles, nbytes int64 
loop: 
for { 
select { 
case size, ok := <-fileSizes: 
if lok { 
break loop // filesizes 关闭 
} 
nfiles++ 
nbytes += size 
case <-tick: 
printDiskUsage(nfiles, nbytes) 
} 


printDiskUsage(nfiles,， nbytes) // 最 终 总 数 
} 
因为 这 个 程序 没有 使 用 range 循环 ， 所 以 第 一 个 select 情况 必须 显 式 判断 filesizes 通 
道 是 否 已 经 关闭 ， 使 用 两 个 返回 值 的 形式 进行 接收 操作 。 如 果 通 道 已 经 关闭 ， 程 序 退 出 
循环 。 标 签 化 的 break 语句 将 跳出 select 和 for 循环 的 逻辑 ;没有 标签 的 break 只 能 跳出 
select 的 逻辑 ， 导 致 循环 的 下 一 次 迭代 。 
程序 提供 给 我 们 一 个 从 容 不 迫 的 更 新 流 : 


$ go build gopl.io/ch8/du2 

$ ./du2 -v $HOME /usr /bin /etc 
28668 files 8.3 GB 

54147 files 16.3 GB 

93591 files 15.1 GB 

127169 files 52.9 GB 
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175931 files 62.2 GB 
213261 files 62.7 GB 


但 是 它 依 然 耗费 太 长 的 时 间 。 这 里 没有 理由 不 能 并 发 调用 walkpir 从 而 充分 利用 磁盘 系 
统 的 并 行 机 制 。 第 三 个 版 本 的 du 为 每 一 个 walkpir 的 调用 创建 一 个 新 的 goroutine。 它 使 用 
sync.WaitGroup (参考 8.5 节 ) 来 为 当前 存活 的 walkpir 调用 计数 ， 一 个 关闭 者 goroutine 在 计 
数 器 减 为 0 的 时 候 关 闭 filesizes 通道 。 
gopl.io/ch8/du3 
func main() { 


// ... 确定 根 目 录 ... 
// 并 行 遍历 每 一 个 文件 树 


fileSizes := make(chan int64) 

var n sync.WaitGroup 

for _, root := range roots { 
n.Add(1) 
go walkDir(root, &n, fileSizes) 


go func() { 
n.Wait() 
close(fileSizes) 


// ... 选择 循环 ... 
} 


func walkDir(dir string, n *sync.WaitGroup, fileSizes chan<- int64) { 
defer n.Done() 
for , entry := range dirents(dir) { 
if entry.IsDir() { 
n.Add(1) 
subdir := filepath.Join(dir, entry.Name()) 
go walkDir(subdir, n, fileSizes) 
} else { 
fileSizes <- entry.Size() 
} 
} 
} 


因为 程序 在 高 峰 时 创建 数 千 个 goroutine， 所 以 我 们 不 得 不 修改 dirents 困 数 来 使 用 计数 
信号 量 ， 以 防止 它 同 时 打开 太 多 的 文件 ， 就 像 我 们 在 8.6 节 中 为 Web 爬虫 所 做 的 : 

// sema 是 一 个 用 于 限制 目录 并 发 数 的 计数 信号 量 

var sema = make(chan struct{}，26) 


// dirents 返回 directory 目录 中 的 条 目 
func dirents(dir string) []os.FileInfo { 


sema <- struct{}{} // 获取 令 牌 
defer func() { <-sema }() // 释放 令 牌 
WA 


尽管 系统 与 系统 之 间 有 很 多 的 不 同 ， 但 是 这 个 版 本 的 速度 比 前 一 个 版 本 快 几 倍 。 
练习 8.9 : 写 一 个 du 版 本 ， 它 可 以 为 每 一 个 指定 的 root 目录 计算 和 定期 输出 各 自 占 用 
的 总 空间 。 


8.9 ” 取 汶 
有 时 候 我 们 需要 让 一 个 goroutine 停止 它 当 前 的 任务 ,例如 ， 一 个 Web 服务 器 对 客户 请 
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求 处 理 到 一 半 的 时 候 客 户 端 断 开 了 。 

一 个 goroutine 无 法 直接 终止 男 一 个 ， 因 为 这 样 会 让 所 有 的 共享 变量 状态 处 于 不 确定 状 
态 。 在 8.7 节 的 火箭 发 射程 序 中 ， 我 们 给 abort 通道 发 送 一 个 值 ， 倒 计时 goroutine 把 它 理解 
为 停止 自己 的 请 求 。 但 是 怎样 才能 取消 两 个 或 者 指定 个 数 的 goroutine 呢 ? 

一 个 可 能 是 给 abort 通道 发 送 和 要 取消 的 goroutine 同样 多 的 事件 。 如 果 一 些 goroutine 
已 经 自己 终止 了 ， 这 样 计 数 就 多 了 ， 然 后 发 送 过 程 会 卡 住 。 如 果 那 些 goroutine 可 以 自我 繁 
殖 ， 数 量 又 会 太 少 ， 其 中 一 些 goroutine 依然 不 知道 要 取消 。 通 常 ， 任 何 时 刻 都 很 难 知 道 有 
多 少 goroutine 正在 工作 。 更 多 情况 下 ， 当 一 个 goroutine 从 abort 通道 接收 到 值 时 ， 它 利用 
这 个 值 ， 这 样 其 他 的 goroutine 接收 不 到 这 个 值 。 对 于 取消 操作 ， 我 们 需要 一 个 可 靠 的 机 制 
在 一 个 通道 上 广播 一 个 事件 ， 这 样 很 多 goroutine 可 以 认为 它 发 生 了 ， 然 后 可 以 看 到 它 已 经 
发 生 。 

回忆 一 下 ， 当 一 个 通道 关闭 且 已 取 完 所 有 发 送 的 值 之 后 ， 接 下 来 的 接收 操作 立即 返回 ， 
得 到 零 值 。 我 们 可 以 利用 它 创 建 一 个 广播 机 制 : 不 在 通道 上 发 送 值 ， 而 是 关闭 它 。 

我 们 在 前 一 节 的 du 程序 中 加 入 取消 机 制 。 第 一 步 ， 创 建 一 个 取消 通道 ， 在 它 上 面 不 
发 送 任何 值 ， 但 是 它 的 关闭 表明 程序 需要 停止 它 正在 做 的 事情 。 也 定义 了 一 个 工具 函数 
cancelled， 在 它 被 调用 的 时 候 检 测 或 轮 询 取消 状态 。 

gop1. io/ch8/du4 
var done = make(chan struct{}) 


func cancelled() bool { 
select { 
case <-done: 
return true 
default: 
return false 
} 
} 


接 下 来 ， 创 建 一 个 读 取 标准 输入 的 goroutine， 它 通常 连接 到 终端 。 一 旦 开始 读 取 任何 
输入 (例如 ， 用 户 按 回 车 键 ) 时 ， 这 个 goroutine 通过 关闭 done 通道 来 广播 取消 事件 。 


// 当 检 测 到 输入 时 取消 遍历 

go func() { 
os.Stdin.Read(make([]byte，1)) // 读 一 个 字 节 
close(done) 


}() 


现在 我 们 需要 让 goroutine 来 响应 取消 操作 。 在 主 goroutine 中 ， 添 加 第 三 个 情况 到 
select 语句 中 ， 它 尝试 从 done 通道 接收 。 如 果 选 择 这 个 情况 ， 函 数 将 返回 ， 但 是 在 返回 之 
前 它 必 须 耗 尽 filesizes 通道 ， 丢 弃 它 所 有 的 值 ， 直 到 通道 关闭 。 做 这 些 是 为 了 保证 所 有 的 
walkDir 调用 可 以 执行 完 ， 不 会 卡 在 向 filesizes 通道 发 送 消息 上 。 


for { 
select { 
case <-done: 
// 耗 尺 fileSizes 以 允许 已 有 的 goroutine 结束 
for range fileSizes { 
// 不 执行 任何 操作 
} 


return 
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case size, ok := <-fileSizes: 


fh 


J} 
} 
walkDir goroutine 在 开始 的 时 候 轮 询 取 消 状态 ， 如 果 设 置 状 态 ， 什 么 都 不 做 立即 返回 。 
它 让 在 取消 后 创建 的 goroutine 什么 都 不 做 : 
func walkDir(dir string, n *sync.WaitGroup, fileSizes chan<- int64) { 
defer n.Done() 


if cancelled() { 
return 


for _, entry := range dirents(dir) { 


} 

} 

在 walkpir 循环 中 来 进行 取消 状态 轮 询 也 许 是 划算 的 ， 它 避免 在 取消 后 创建 新 的 
goroutine。 取 消 需要 权衡 : 更 快 的 响应 通常 需要 更 多 的 程序 逻辑 变更 人 侵 。 确 保 在 取消 事件 
以 后 没有 更 多 昂贵 的 操作 发 生 ， 可 能 需要 更 新 代码 中 很 多 的 地 方 ， 但 通常 我 们 可 以 通过 在 少 
量 重要 的 地 方 检查 取消 状态 来 达到 目的 。 

程序 的 一 点 性 能 剖析 揭示 了 它 的 瓶颈 在 于 dirents 中 获取 信和 号 量 令 牌 的 操作 。 下 面 的 
select 让 取消 操作 的 延迟 从 数 百 毫 秒 减 为 几 十 毫秒 : 

func dirents(dir string) []os.FileInfo { 

select { 
case sema 《- struct{}{}: // 获取 令 牌 


case <-done: 
return nil // 取消 


} 
defer func() {<-sema }() // 释放 令 牌 
// ...read directory... 


} 


现在 ， 当 取消 事件 发 生 时 ， 所 有 的 后 台 goroutine 迅速 停止 ， 然 后 main 函数 返回 。 当 
然 ， 当 main 返回 时 ， 程 序 随 之 退出 ， 不 过 这 里 没有 谁 在 后 面 通知 main 函数 来 进行 清理 。 在 
测试 中 有 一 个 技巧 : 如 果 在 取消 事件 到 来 的 时 候 main 函数 没有 返回 ， 执 行 一 个 panic 调 
用 ， 然 后 运行 时 将 转 储 程序 中 所 有 goroutine 的 栈 。 如 果 主 goroutine 是 最 后 一 个 剩 下 的 
goroutine， 它 需要 自己 进行 清理 。 但 如 果 还 有 其 他 的 goroutine 存活 ， 它 们 可 能 还 没有 合适 
地 取消 ， 或 者 它们 已 经 取消 ， 可 是 需要 的 时 间 比 较 长 ;多 一 点 调查 总 是 值得 的 。 骨 省 转 储 信 
息 通常 含有 足够 的 信息 来 分 辨 这 些 情 况 。 

练习 8.10 : HTTP 请 求 可 以 通过 关闭 http.Request 结构 中 可 选 的 cancel 通道 进行 取消 。 
修改 8.6 节 的 网 页 疏 虫 使 其 支持 取消 操作 。 

提示 : http.Get 便利 函数 没有 提供 定制 Request 的 机 会 。 使 用 http.NewRequest 创建 请 求 ， 
设置 它 的 cancel 字段 ， 然 后 调用 http.Defaultclient.Do(req) 来 执行 请 求 。 

练习 8.11 : 使 用 8.4.4 节 的 mirroredQuery 程序 中 的 方法 ， 实 现 fetch 的 一 个 变种 ， 它 并 
发 请 求 多 个 URL。 当 第 一 个 响应 返回 的 时 候 ， 取 消 其 他 的 请 求 。 
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8.10 示例: 聊天 服务 器 


我 们 用 聊天 服务 器 来 结束 本 章 ， 它 可 以 在 几 个 用 户 之 间 相 互 广播 文本 消息 。 这 个 程序 里 
有 4 个 goroutine。 主 goroutine 和 广播 (broadcaster) goroutine， 每 一 个 连接 里 面 有 一 个 连接 
处 理 (handleconn) goroutine 和 一 个 客户 写 人 (clientwriter) goroutine。 广 播 器 (broadcaster) 
是 关于 如 何 使 用 select 的 一 个 规范 说 明 ， 因 为 它 需要 对 三 种 不 同 的 消息 进行 响应 。 

如 下 所 示 ， 主 goroutine 的 工作 是 监听 端口 ， 接 受 连 接客 户 端的 网 络 连接 。 对 每 一 个 连 
接 ， 它 创建 一 个 新 的 handleconn goroutine， 就 像 本 章 开始 时 并 发 回声 服务 器 中 那样 。 

gopl.io/ch8/chat 
func main() { 
listener, err := net.Listen("tcp", "localhost:86860") 


if err != nil { 
log.Fatal(err) 


} 
go broadcaster() 
for { 
conn, err := listener.Accept() 
if err != nil { 
log.Print(err) 
continue 
go handleConn(conn) 
} 


} 
下 一 个 是 广播 器 ， 它 使 用 局 部 变量 clients 来 记录 当前 连接 的 客户 集合 。 每 个 客户 唯一 
被 记录 的 信息 是 其 对 外 发 送 消息 通道 的 ID， 下 面 是 细节 : 


type client chan<- string // 对 外 发 送 消息 的 通道 


var ( 

entering = make(chan client) 

leaving = make(chan client) 

messages = make(chan string) // 所 有 接收 的 客户 消息 
) 


func broadcaster() { 
| clients := make(map[client]bool) // 所 有 连接 的 客户 端 


for { 
select { 
case msg := <-messages: 
// 把 所 有 接收 的 消息 广播 给 所 有 的 客户 
// 发 送 消息 通道 
for cli := range clients { 
cli <- msg 
} 
case cli := <-entering: 
clients[cli] = true 
case cli := <-leaving: 
delete(clients, cli) 
close(cli) 
} 2 
} 


} 
广播 者 监听 两 个 全 局 的 通道 entering 和 leaving， 通 过 它们 通知 客户 的 到 来 和 离开 ， 如 
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果 它 从 其 中 一 个 接收 到 事件 ， 它 将 更 新 clients 集合 。 如 果 客 户 离开 ,那么 它 关 闭 对 应 客户 
对 外 发 送 消息 的 通道 。 广 播 者 也 监听 来 自 messages 通道 的 事件 ， 所 有 的 客户 都 将 消息 发 送 到 
这 个 通道 。 当 广播 者 接收 到 其 中 一 个 事件 时 ， 它 把 消息 广播 给 所 有 客户 。 

现在 来 看 一 下 每 个 客户 自己 的 goroutine。handleconn 函数 创建 一 个 对 外 发 送 消息 的 新 通 
道 ， 然 后 通过 entering 通道 通知 广播 者 新 客户 到 来 。 接 着 ， 它 读 取 客户 发 来 的 每 一 行文 本 ， 
通过 全 局 接收 消息 通道 将 每 一 行 发 送 给 广播 者 ， 发 送 时 在 每 条 消息 前 面 加 上 发 送 者 ID 作为 
前 级 。 一 旦 从 客户 端 读 取 完毕 消息 ，handleconn 通过 leaving 通道 通知 客户 离开 ， 然 后 关闭 
连接 。 

func handleConn(conn net.Conn) { 


ch := make(chan string) // 对 外 发 送 客户 消息 的 通道 
go clientWriter(conn, ch) 


who := conn.RemoteAddr().String() 
ch <- "You are " + who 

messages <- who + " has arrived" 
entering <- ch 


input := bufio.NewScanner(conn) 
for input.Scan() { 
messages <- who + ": " + input.Text() 


} 
// 注意 ， 忽 略 input.Err() 中 可 能 的 错误 


leaving <- ch 
messages <- who + " has left" 
conn.Close() 


} 
func clientWriter(conn net.Conn, ch <-chan string) { 
for msg := range ch { 
fmt.Fprintln(conn，msg) // 注意 ， 忽略 网 络 层面 的 错误 
} 
} 


另外 ，handleconn 函数 还 为 每 一 个 客户 创建 了 写 人 (clientwriter) goroutine， 它 接收 消 
息 , 广播 到 客户 的 发 送 消息 通道 中 ， 然 后 将 它们 写 到 客户 的 网 络 连 接 中 。 客 户 写 人 者 的 循环 
在 广播 者 收 到 leaving 通知 并 且 关 闭 客户 的 发 送 消息 通道 后 终止 。 

下 面 的 信息 展示 了 同一 个 机 器 上 的 一 个 服务 器 和 两 个 客户 端 ， 它 们 使 用 netcat 程序 来 
聊天 : 


$ go build gopl.io/ch8/chat 
$ go build gopl.io/ch8/netcat3 


$ ./chat & 
$ ./netcat3 
You are 127.6.6.1:64268 $ ./netcat3 
127.0.0.1:64211 has arrived You are 127.6.6.1:64211 
Hil 
127.0.0.1:64268: Hil 127.6.0.1:64208: Hil 
Hi yourself. 
127.0.0.1:64211: Hi yourself. 127.6.6.1:64211: Hi yourself. 
-CG 
127.6.6.1:64268 has left 
$ ./netcat3 
You are 127.0.0.1:64216 127.6.6.1:64216 has arrived 


Welcome. 
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127.6.6.1:64211: Welcome. 127.0.0.1:64211: Welcome. 

127.6.6.1:64211 has left 

当 有 nn 个 客户 session 在 连接 的 时 候 ， 程 序 并 发 运行 着 2n+2 个 相互 通信 的 goroutine， 
它 不 需要 隐 式 的 加 锁 操 作 (参考 9.2 节 )。clients map 限制 在 广播 器 这 一 个 goroutine 中 被 访 
问 ， 所 以 不 会 并 发 访问 它 。 唯 一 被 多 个 goroutine 共享 的 变量 是 通道 以 及 net.conn 的 实例 ， 
它们 又 都 是 并 发 安全 的 。 关 于 限制 、 并 发 安全 ， 以 及 跨 goroutine 的 变量 共享 的 含义 ， 将 在 
下 一 章 进行 更 多 的 讨论 。 

练习 8.12 : 让 广播 者 在 每 一 个 新 客户 到 来 的 时 候 通知 当前 存在 的 客户 。 这 也 要 求 
clients 集合 以 及 entering 和 leaving 通道 记录 客户 的 名 字 。 

练习 8.13 : 使 聊天 服务 器 可 以 断 掉 长 期 空置 的 连接 ， 例 如 在 过 去 5 分 钟 里 没有 发 送 过 
消息 的 连接 。 提 示 : 在 另 一 个 goroutine 中 调用 conn.close()， 可 以 让 当前 阻塞 的 读 操 作 变 成 
非 阻塞 ， 就 像 input.scan() 输入 完成 的 读 操作 一 样 。 

练习 8.14 : 改变 聊天 服务 器 的 网 络 交 互 协 议 ， 让 客户 端 可 以 输入 它 的 名 字 。 使 用 名 字 
来 代替 网 络 地 址 作为 发 送 者 的 ID， 作 为 每 一 条 消息 的 前 级 。 

练习 8.15 : 任何 客户 程序 读 取 数 据 的 时 间 很 长 最 终 会 造成 所 有 的 客户 卡 住 。 修 改 广播 
者 ， 使 它 满足 如 果 一 个 向 客户 写 和 人 的 通道 没有 准备 好 接受 它 ， 那 么 跳 过 这 条 消息 。 还 可 以 给 
每 一 个 给 向 客户 发 送 消息 的 通道 增加 缓冲 ， 这 样 大 多 数 的 消息 不 会 丢弃 ; 广播 者 在 这 个 通道 
上 应 该 使 用 非 阻塞 的 发 送 方式 。 
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上 一 章 用 几 个 程序 来 演示 了 如 何 使 用 goroutine 和 通道 来 实现 一 种 直接 和 自然 的 并 发 方 
式 。 当 然 ， 我 们 避 开 了 一 些微 妙 的 要 点 ， 这 些 点 是 写 并 发 代码 时 必须 铭记 在 心 的 。 

本 章 将 深入 到 并 发 机 制 内 部 ， 特 别 是 与 多 个 goroutine 共享 变量 相关 的 问题 ， 以 及 识别 
这 些 问 题 的 分 析 技 术 ， 还 有 解决 这 些 问题 的 模式 。 最 后 将 解释 一 下 goroutine 和 操作 系统 线 
程 的 差别 。 


9.1 竞 态 


在 串 行 程序 中 ( 即 一 个 程序 只 有 一 个 goroutine)， 程 序 中 各 个 步骤 的 执行 顺序 由 程序 逻 
辑 来 决定 。 比 如 ， 在 一 系列 语句 中 ， 第 一 句 在 第 二 名 之 前 执行 ， 以 此 类 推 。 当 一 个 程序 有 两 
个 或 者 多 个 goroutine 时 ， 每 个 goroutine 内 部 的 各 个 步 又 也 是 顺序 执行 的 ， 但 我 们 无 法 知道 
一 个 goroutine 中 的 事件 x 和 另外 一 个 goroutine 中 的 事件 y 的 先后 顺序 。 如 果 我 们 无 法 自信 
地 说 一 个 事件 肯定 先 于 另外 一 个 事件 ， 那 么 这 两 个 事件 就 是 并 发 的 。 

考虑 一 个 能 在 串 行 程序 中 正确 工作 的 函数 。 如 果 这 个 函数 在 并 发 调用 时 仍然 能 正确 工 
作 ， 那 么 这 个 函数 是 并 发 安全 ( concurrency-safe) 的 ， 在 这 里 并 发 调用 是 指 ， 在 没有 额外 同 
步 机制 的 情况 下 ， 从 两 个 或 者 多 个 goroutine 同时 调用 这 个 函数 。 这 个 概念 也 可 以 推广 到 其 
他 函数 ， 比 如 方法 或 者 作用 于 特定 类 型 的 一 些 操作 。 如 果 一 个 类 型 的 所 有 可 访问 方法 和 操作 
都 是 并 发 安全 时 ， 则 它 可 称 为 并 发 安全 的 类 型 。 

让 一 个 程序 并 发 安全 并 不 需要 其 中 的 每 一 个 具体 类 型 都 是 并 发 安全 的 。 实 际 上 ， 并 发 安 
全 的 类 型 其 实 是 特例 而 不 是 普遍 存在 的 ， 所 以 仅 在 文档 指出 类 型 是 安全 的 情况 下 ， 才 可 以 
并 发 地 访问 一 个 变量 。 对 于 绝 大 部 分 变量 ， 如 要 回避 并 发 访问 ， 要 么 限制 变量 只 存在 于 一 个 
goroutine 内 ， 要 么 维护 一 个 更 高 层 的 互 斥 不 变量 。 本 章 将 详细 解释 这 些 概 念 。 

与 之 对 应 的 是 ， 导 出 的 包 级 别 函数 通常 可 以 认为 是 并 发 安全 的 。 因 为 包 级 别 的 变量 无 法 
限制 在 一 个 goroutine 内 ， 所 以 那些 修改 这 些 变量 的 函数 就 必须 采用 互 斥 机 制 。 

函数 并 发 调用 时 不 工作 的 原因 有 很 多 ， 包 括 死 锁 、 活 锁 (livelock) “以 及 资源 耗 尽 。 我 
们 没有 足够 的 时 间 来 讨论 所 有 的 情形 ， 因 此 接 下 来 会 重点 讨论 最 重要 的 一 种 情形 ， 即 竞 态 。 

竞 态 是 指 在 多 个 goroutine 按 某 些 交错 顺序 执行 时 程序 无 法 给 出 正确 的 结果 。 竞 态 对 于 
程序 是 致命 的 ， 因 为 它们 可 能 会 潜伏 在 程序 中 ， 出 现 频率 也 很 低 ， 有 可 能 仅 在 高 负载 环境 或 
者 在 使 用 特定 的 编译 器 、 平 台 和 架构 时 才 出 现 。 这 些 都 让 竞 态 很 难 再 现 和 分 析 。 

我 们 常用 一 个 经 济 损失 的 隐喻 来 解释 竞 态 的 严重 性 ， 在 这 里 也 先 考虑 一 个 简单 的 银行 账 
户 程序 : 


// bank 包 实 现 了 一 个 只 有 一 个 账户 的 银行 
package bank 


日 ”比如 多 个 线程 在 尝试 绕 开 死 锁 ， 却 由 于 过 分 同步 导致 反复 冲突 。 一 一 译 者 注 
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var balance int 
func Deposit(amount int) { balance = balance + amount } 


func Balance() int { return balance } 


( Deposit 的 函数 体 也 可 以 写作 等 价 的 balance += amount， 但 比较 长 的 形式 解释 起 来 比较 
方便 。) 

对 于 一 个 如 此 简单 的 程序 ， 我 们 一 眼 就 可 以 看 出 ， 任 意 串 行 地 调用 peposit 和 Balance 
都 可 以 得 到 正确 的 结果 。 即 Balance 会 输出 之 前 存 人 的 金额 总 数 。 但 如 果 这 些 函 数 的 调用 顺 
序 不 是 串 行 而 是 并 行 ，Balance 就 不 保证 输出 正确 结果 了 。 考 虑 如 下 两 个 goroutine， 它 们 代 
表 对 一 个 共享 账户 的 两 笔 交 易 : 


// Alice: 
go func() { 
bank.Deposit(266) // A 
fmt.Println("=", bank.Balance()) // A2 
FC 
// Bob: 
go bank.Deposit(166) yr:B 


Alice 存 人 200 美元 ， 然 后 查询 她 的 余额 ， 与 此 同时 Bob 存 人 了 100 美元 。A1、A2 两 步 
与 8 是 并 发 进行 的 ， 我 们 无 法 预测 实际 的 执行 顺序 。 直 觉 来 看 ， 可 能 存在 三 种 不 同 的 顺序 ， 
分 别称 为 “Alice 先 "、“ Bob 先 ” 和 “Alice/Bob/Alice”。 下 面 的 表格 显示 了 每 个 步骤 之 后 
balance 变量 的 值 。 带 引号 的 字符 串 代 表 输 出 的 账户 余额 。 


Alice 先 Bob 先 Alice/Bob/Alice 

0 9 0 
Al 266 B 166 Al 266 
A2 “= 200" A1 366 B 366 
B 366 A2 "= 3006" A2 "= 3606" 


在 所 有 情况 下 最 终 的 账户 余额 都 是 300 美元 。 唯 一 不 同 的 是 Alice 看 到 的 账户 余额 是 否 
包含 了 Bob 的 交易 ， 但 客户 对 所 有 情况 都 不 会 有 不 满 。 

但 这 种 直觉 是 错 的 。 这 里 还 有 第 四 种 可 能 ，Bob 的 存款 在 Alice 的 存款 操作 中 间 执 行 ， 
晚 于 账户 余额 读 取 (balancetamount)， 但 早 于 余额 更 新 (balance = ...)， 这 会 导致 Bob 存 的 
钱 消失 了 。 这 是 因为 Alice 的 存款 操作 Ad 实际 上 是 串 行 的 两 个 操作 ， 读 部 分 和 写 部 分 ， 我们 
称 之 为 Alr 和 Alw。 下 面 就 是 有 问题 的 执行 顺序 : 


0 
Alr 0 ... = balance + amount 
B 166 
Alw 266 balance = ... 
A2 "= 2606" 


在 Alr 之 后 ， 表 达 式 balance + amount 求 值 结 果 为 200， 这 个 值 在 Alw 步骤 中 用 于 写 和 人 ， 
完全 没 理会 中 间 的 存款 操作 。 最 终 的 余额 为 仅 有 200 美元 ， 银 行 从 Bob 手 上 挣 了 100 美元 。 

程序 中 的 这 种 状况 是 竞 态 中 的 一 种 ， 称 为 数据 竞 态 ( data race)。 数 据 竞 态 发 生 于 两 个 
goroutine 并 发 读 写 同 一 个 变量 并 且 至 少 其 中 一 个 是 写 人 时 。 

当 发 生 数 据 竞 态 的 变量 类 型 是 大 于 一 个 机 器 字 长 的 类 型 (比如 接口 、 字 符 串 或 slice) 
时 ,事情 就 更 复杂 了 。 下 面 的 代码 并 发 把 x 更 新 为 两 个 不 同 长 度 的 slice。 
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var x []int 

go func() { x = make([]int，16) }() 

go func() { x = make([]int，1666668) }() 

x[999999] = 1 // 注意 : 未 定义 行为 ， 可 能 造成 内 存 异 党 

最 后 一 个 表达 式 中 x 的 值 是 未 定义 的 ， 它 可 能 是 nil、 一 个 长 度 为 10 的 slice 或 者 一 个 
长 度 为 1 000 000 的 slice。 回 想 一 下 slice 的 三 个 部 分 : 指针 、 长 度 和 容量 。 如 果 指 针 来 自 于 
第 一 个 make 调用 而 长 度 来 自 第 二 个 make 调用 ， 那么 x 会 变 成 一 个 髓 合体 ， 它 名 义 上 长 度 为 
1 000 000 但 底层 的 数组 只 有 10 个 元 素 。 在 这 种 情况 下 ， 尝 试 存储 到 第 999 999 个 元 素 会 伤 
及 很 遥远 的 一 段 内 存 ， 其 恶果 无 法 预测 ， 问 题 也 很 难 调试 和 定位 。 这 种 语义 上 的 雷 区 称 为 未 
定义 行为 ，C 程序 员 应 当 对 此 很 熟悉 了 。 幸 运 的 是 ， 相 比 之 下 Go 语言 很 少 有 这 种 问题 。 

并 行程 序 是 几 个 串 行程 序 交错 执行 这 个 观念 也 是 一 个 错觉 。 在 9.4 节 中 可 以 看 到 ， 数 据 
竞 态 可 能 由 更 奇怪 的 原因 来 引发 。 很 多 程序 员 (甚至 是 非常 聪明 的 程序 员 ) 偶尔 也 会 为 自己 
程序 中 的 数据 竞 态 找 借口 ， 比 如 “ 互 斥 机 制 的 成 本 太 高 了 ”“ 这 上段 逻辑 只 用 于 输出 日 志 ”“ 我 
不 在 意 丢 掉 一 些 消息 ”等 。 在 给 定 的 编译 器 和 平台 下 不 存在 问题 也 给 了 他 们 盲目 的 自信 。 一 
个 好 的 习惯 是 根本 就 没有 什么 温和 的 数据 竞 态 。 所 以 如 何在 程序 中 避免 数据 兖 态 呢 ? 

再 回顾 一 下 定义 (因为 定义 非常 重要 ) : 数据 竞 态 发 生 于 两 个 goroutine 并 发 读 写 同一 个 
变量 并 且 至 少 其 中 一 个 是 写 人 时 。 从 定义 不 难看 出 ， 有 三 种 方法 来 避免 数据 况 态 。 

第 一 种 方法 是 不 要 修改 变量 。 考 虑 如 下 的 map， 它 进行 了 延迟 初始 化 ， 对 于 每 个 键 ， 在 
第 一 次 访问 时 才 触 发 加 载 。 如 果 Icon 的 调用 是 串 行 的 ， 那 么 程序 能 正常 工作 ， 但 如 果 Icon 
的 调用 是 并 发 的 ， 在 访问 map 时 就 存在 数据 竞 态 。 

var icons = make(map[string]image.Image) 

func loadIcon(name string) image.Image 


// 注意 : 并 发 不 安全 
func Icon(name string) image.Image { 
icon, ok := icons[name] 
if !ok { 
icon = loadIcon(name) 
icons[name] = icon 


return icon 


} 
如 果 在 创建 其 他 goroutine 之 前 就 用 完整 的 数据 来 初始 化 map， 并 且 不 再 修改 。 那 么 无 
论 多 少 goroutine 也 可 以 安全 地 并 发 调用 Icon， 因 为 每 个 goroutine 都 只 读 取 这 个 map。 


var icons = map[string]image.Image{ 


"spades.png": loadIcon("spades.png"), 
"hearts.png": loadIcon("hearts.png"), 
"diamonds.png": loadIcon("diamonds.png"), 
"clubs.png": loadIcon("clubs.png"), 

} 

// 并 发 安全 


func Icon(name string) image.Image { return icons[name] } 


在 上 面 的 例子 中 ，icons 变量 的 赋值 发 生 在 包 初 始 化 时 ， 也 就 是 在 程序 的 main 函数 开始 
运行 之 前 。 一 旦 初始 化 完成 后 ，icons 就 不 再 修改 。 那 些 从 不 修改 的 数据 结构 以 及 不 可 变数 
据 结构 本 质 上 是 并 发 安全 的 ， 也 不 需要 做 任何 同步 。 但 显然 我 们 不 能 把 这 个 方法 用 在 必然 会 
有 更 新 的 场景 ， 比 如 一 个 银行 账号 。 
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第 二 种 避免 数据 竞 态 的 方法 是 避免 从 多 个 goroutine 访问 同一 个 变量 。 上 一 音 的 很 多 程 
序 都 采用 了 这 个 方法 。 比 如 ， 并 发 的 Web 疏 虫 ( 见 8.6 节 ) 中 主 goroutine 是 唯一 一 个 能 访 
问 seen map 的 goroutine ; 聊天 服务 器 ( 见 8.10 节 ) 中 的 broadcaster goroutine 是 唯一 一 个 
能 访问 clients map 的 goroutine。 这 些 变量 都 限制 在 单个 goroutine 内 部 。 

由 于 其 他 goroutine 无 法 直接 访问 相关 变量 ， 因 此 它们 就 必须 使 用 通道 来 向 受 限 
goroutine 发 送 查 询 请 求 或 者 更 新 变量 。 这 也 是 这 名 Go 艇 言 的 含义 :“ 不 要 通过 共享 内 存 
来 通信 ， 而 应 该 通过 通信 来 共享 内 存 ”。 使 用 通道 请 求 来 代理 一 个 受 限 变 量 的 所 有 访问 的 
goroutine 称 为 该 变量 的 监控 goroutine ( monitor goroutine)。 比 如 ，broadcaster goroutine 监 
控 了 对 clients map 的 访问 。 

下 面 就 是 重 写 的 银行 案例 ， 用 一 个 叫 teller 的 监控 goroutine 限制 balance 变量 : 

gop1. io/ch9/bank1 


// bank 包 提 供 了 一 个 只 有 一 个 账户 的 并 发 安全 银行 
package bank 


var deposits = make(chan int) // 发 送 存 款额 
var balances = make(chan int) // 接收 余额 


func Deposit(amount int) { deposits <- amount } 
func Balance() int { return <-balances } 


func teller() { 
var balance int // balance 被 限制 在 teller goroutine 中 
fo: 1 
select { 
case amount := <-deposits: 
balance += amount 
case balances <- balance: 
} 
} 
} 


func init() { 
go teller() // 启动 监控 goroutine 


即使 一 个 变量 无 法 在 整个 生命 周期 受 限 于 单个 goroutine， 加 以 限制 仍然 可 以 是 解决 并 
发 访问 的 好 方法 。 比 如 一 个 常见 的 场景 ， 可 以 通过 借助 通道 来 把 共享 变量 的 地 址 从 上 一 步 传 
到 下 一 步 ， 从 而 在 流水 线 上 的 多 个 goroutine 之 间 共 享 该 变量 。 在 流水 线 中 的 每 一 步 ， 在 把 
变量 地 址 传 给 下 一 步 后 就 不 再 访问 该 变量 了 ， 这 样 所 有 对 这 个 变量 的 访问 都 是 串 行 的 。 换 个 
说 法 ， 这 个 变量 先 受 限 于 流水 线 的 一 步 ， 再 受 限 于 下 一 步 ， 以 此 类 推 。 这 种 受 限 有 时 也 称 为 
串 行 受 限 。 

在 下 面 的 例子 中 ，cakes 是 串 行 受 限 的 ， 首 先 受 限于 baker goroutine， 然 后 受 限 于 icer 
goroutine。 


type Cake struct{ state string } 


func baker(cooked chan<- *Cake) { 
for { 
cake := new(Cake) 
cake.state = "cooked" 
cooked <- cake // baker 不 再 访问 cake 变量 
} 
} 
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func icer(iced chan<- *Cake, cooked <-chan *Cake) { 
for cake := range cooked { 
cake.state = "iced" 
iced <- cake // icer 不 再 访问 cake 交 量 
} 
} 
第 三 种 避免 数据 竞 态 的 办 法 是 允许 多 个 goroutine 访问 同一 个 变量 , 但 在 同一 时 间 只 有 
一 个 goroutine 可 以 访问 。 这 种 方法 称 为 互 斥 机 制 ， 这 是 下 一 节 的 主题 。 
练习 9.1: 向 gop1l.io/ch9/bank1 程序 添加 一 个 函数 thdraw(amount int)bool。 结果 应 当 反 
映 交易 成 功 还 是 由 于 余额 不 足 而 失败 。 函 数 发 送 到 监控 goroutine 的 消息 应 当 包 含 取款 金额 和 


一 个 新 的 通道 ， 这 个 通道 用 于 监控 goroutine 把 布尔 型 的 结果 发 送 回 withdraw 函数 。 


9.2 互 斥 锁 : sync .Mutex 


在 8.6 节 ， 使 用 一 个 缓冲 通道 实现 了 一 个 计数 信号 量 ， 用 于 确认 同时 发 起 HTTP 请 求 
的 goroutine 数量 不 超过 20。 使 用 同样 的 理念 ， 也 可 以 用 一 个 容量 为 1 的 通道 来 保证 同一 
时 间 最 多 有 一 个 goroutine 能 访问 共享 变量 。 一 个 计数 上 限 为 1 的 信号 量 称 为 二 进 制 信号 量 
(binary semaphore ) 。 


8&op1l.io/ch9/bank2 

var ( 
sema = make(chan struct{}，1) // 用 来 保护 balance 的 二 进 制 信号 量 
balance int 

) 

func Deposit(amount int) { 
sema <- struct{}{} // 获取 令 牌 
balance = balance + amount 
<-Sema // 释放 令 牌 

} 

func Balance() int { 
sema <- struct{}{} // 获取 令 牌 
b := balance 
<-sema // 释放 令 牌 


return b 


} 
互 斥 锁 模式 应 用 非常 广泛 ， 所 以 sync 包 有 一 个 单独 的 Mutex 类 型 来 支持 这 种 模式 。 它 的 
Lock 方 法 用 于 获取 令 牌 (token， 此 过 程 也 称 为 上 锁 )，unlock 方法 用 于 释放 令 牌 : 


gopl.io/ch9/bank3 
import "sync" 


var ( 
mu sync.Mutex // 保护 balance 
balance int 

) 

func Deposit(amount int) { 
mu.Lock() 
balance = balance + amount 
mu.Unlock() 

} 

func Balance() int { 


mu.Lock() 

b := balance 
mu.Unlock() 
return b 
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一 个 goroutine 在 每 次 访问 银行 的 变量 (此 处 仅 有 balance) 之 前 ， 它 都 必须 先 调用 互 斥 
量 的 Lock 方法 来 获取 一 个 互 斥 锁 。 如 果 其 他 goroutine 已 经 取 走 了 互 斥 锁 ， 那 么 操作 会 一 直 
阻塞 到 其 他 goroutine 调用 unlock 之 后 (此 时 互 斥 锁 再 度 可 用 )。 互 斥 量 保护 共享 变量 。 按 照 
惯例 ， 被 互 斥 量 保护 的 变量 声明 应 当 紧 接 在 互 斥 量 的 声明 之 后 。 如 果实 际 情况 不 是 如 此 ， 请 
确认 已 加 了 注释 来 说 明 此 事 。 

在 Lock 和 unlock 之 间 的 代码 ， 可 以 自由 地 读 取 和 修改 共享 变量 ， 这 一 部 分 称 为 临界 
区 域 。 在 锁 的 持 有 人 调用 unlock 之前， 其 他 goroutine 不 能 获取 锁 /。 所 以 很 重要 的 一 点 是 ， 
goroutine 在 使 用 完成 后 就 应 当 释 放 锁 ， 另 外 ， 需 要 包括 函数 的 所 有 分 支 ， 特 别 是 错误 分 支 。 

上 面 的 银行 程序 展现 了 一 个 典型 的 并 发 模式 。 几 个 导出 函数 封装 了 一 个 或 多 个 变量 ， 于 
是 只 能 通过 这 些 函 数 来 访问 这 些 变量 (对 于 一 个 对 象 的 变量 ， 则 用 方法 来 封装 )。 每 个 函数 
在 开始 时 申请 一 个 互 斥 锁 ， 在 结束 时 再 释放 掉 ， 通 过 这 种 方式 来 确保 共享 变量 不 会 被 并 发 访 
问 。 这 种 函数 、 互 斥 锁 、 变 量 的 组 合 方式 称 为 监控 (monitor) 模式 。( 之 前 在 监控 goroutine 
中 也 使 用 了 监控 (monitor) 这 个 词 ， 都 代表 使 用 一 个 代理 人 (broker) 来 确保 变量 按 顺序 
访问 。) 

因为 Deposit 和 Balance 函数 中 的 临界 区 域 都 很 短 (只 有 一 行 ， 也 没有 分 支 )， 所 以 直接 
在 函数 结束 时 调用 unlock 也 很 方便 。 在 更 复杂 的 临界 场景 中 ， 特 别 是 必须 通过 提前 返回 来 
处 理 错误 的 场景 ， 很 难 确 定 在 所 有 的 分 支 中 Lock 和 unlock 都 成 对 执行 了 。Go 语言 的 defer 
语句 就 可 以 解决 这 个 问题 : 通过 延迟 执行 unlock 就 可 以 把 临界 区 域 隐 式 扩展 到 当前 函数 的 
结尾 ， 避 免 了 必须 在 一 个 或 者 多 个 远离 Lock 的 位 置 插入 一 条 unlock 语句 。 

func Balance() int { 

mu.Lock() 
defer mu.Unlock() 


return balance 


} 


在 上 面 的 例子 中 ，unlock 在 return 语句 已 经 读 完 balance 变量 之 后 执行 ， 所 以 Balance 
函数 就 是 并 发 安全 的 。 另 外 ， 我 们 也 不 需要 使 用 局 部 变量 b 了 。 
而 且 ， 在 临界 区 域 崩 溃 时 延迟 执行 的 unlock 也 会 正确 执行 ， 这 在 使 用 recover( 参 考 5.10 
节 ) 的 情况 下 尤其 重要 。 当 然 ，defer 的 执行 成 本 比 显 式 调用 unlock 略 大 一 些 ， 但 不 足以 成 
为 代码 不 清晰 的 理由 。 在 处 理 并 发 程序 时 ， 永 远 应 当 优先 考虑 清晰 度 ， 并 且 拒 绝 过 早 优化 。 
在 可 以 使 用 的 地 方 ， 就 尽量 使 用 defer 来 让 临界 区 域 扩展 到 函数 结尾 处 。 
考虑 如 下 Withdraw 国 数 。 当 成 功 时 ， 余 额 减少 了 指定 的 数量 ， 并 且 返 回 true， 但 如 果 余 
额 不 足 ， 无 法 完成 交易 ，withdraw 恢复 余额 并 且 返 回 false。 
// 注意 : 不 是 原子 操作 
func Withdraw(amount int) bool { 
Deposit(-amount) 
if Balance() < 6 { 
Deposit(amount) 


return false // 余额 不 足 
上 


return true 


} 


这 个 函数 最 终 能 给 出 正确 的 结果 ,但 它 有 一 个 不 良 的 副作用 。 在 尝试 进行 超额 提 款 时 ， 
在 某 个 瞬间 余额 会 降 到 0 以 下 。 这 有 可 能 会 导致 一 个 小 额 的 取款 会 不 合 逻 辑 地 被 拒绝 掉 。 所 
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以 当 Bob 尝试 购买 一 辆 跑车 时 ， 却 会 导致 Alice 无 法 支付 早上 的 咖啡 。withdraw 的 问题 在 于 
不 是 原子 操作 : 它 包 含 三 个 串 行 的 操作 ， 每 个 操作 都 申请 并 释放 了 互 斥 锁 ， 但 对 于 整个 序列 
没有 上 锁 。 

理想 情况 下 ，withdraw 应 当 为 整个 操作 申请 一 次 互 斥 锁 。 但 如 下 尝试 是 正确 的 : 

// 注意 : 不 正确 的 实现 


func Withdraw(amount int) bool { 
mu.Lock() 
defer mu.Unlock() 
Deposit(-amount) 
if Balance() < 0 f{ 
Deposit(amount) 
return false // 余额 不 足 


return true 


} 

Deposit 会 通过 调用 mu.Lock() 来 尝试 再 次 获取 互 斥 锁 ， 但 由 于 互 斥 锁 是 不 能 再 入 的 《无 
Sh -个 已 经 上 锁 的 互 斥 量 再 上 锁 )， 因 此 这 会 导致 死 锁 ，Withdraw 会 一 直 被 卡 住 。 

o 语言 的 互 斥 量 是 不 可 再 人 的 ， 具 体 理 由 见 后 。 互 斥 量 的 目的 是 在 程序 执行 过 程 中 维 
se ( invariant)。 其 中 一 个 不 变量 是 “没有 goroutine 正在 访问 这 
个 共享 变量 "， 但 有 可 能 互 斥 量 也 保护 针对 数据 结构 的 其 他 不 变量 。 当 goroutine 获取 一 个 互 
斥 锁 的 时 候 ， 它 可 能 会 假定 这 些 不 变量 是 满足 的 。 当 它 获 取 到 互 斥 锁 之 后 ， 它 可 能 会 更 新 共 
享 变量 的 值 ， 这 样 可 能 会 临时 不 满足 之 前 的 不 变量 。 当 它 释 放 互 斥 锁 时 ， 它 必须 保证 之 前 的 
不 变量 已 经 还 原 且 又 能 重新 满足 。 尽 管 一 个 可 重 和 的 互 斥 量 可 以 确保 没有 其 他 goroutine 可 
以 访问 共享 变量 ， 但 是 无 法 保护 这 些 变量 的 其 他 不 变量 。 

一 个 常见 的 解决 方案 是 把 peposit 这 样 的 函数 拆 分 为 两 部 分 : 一 个 不 导出 的 函数 
deposit， 它 假定 已 经 获得 互 斥 锁 ， 并 完成 实际 的 业务 逻辑 ;以 及 一 个 导出 的 函数 peposit， 
它 用 来 获取 锁 并 调用 deposit。 这 样 我 们 就 可 以 用 deposit 来 实现 withdraw: 

func Withdraw(amount int) bool { 

mu.Lock() 

defer mu.Unlock() 

deposit(-amount) 

if balance < 0 { 


deposit(amount) 
return false // 余额 不 足 


return true 


} 

func Deposit(amount int) { 
mu.Lock() 
defer mu.Unlock() 
deposit(amount) 

} 

func Balance() int { 
mu.Lock() 
defer mu.Unlock() 
return balance 

} 


// 这 个 函数 要 求 已 获取 互 斥 锁 


func deposit(amount int) { balance += amount } 
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当然 ， 这 里 的 deposit 函数 代码 太 少 了 ， 所 以 实际 上 withdraw 函数 可 以 不 用 调用 这 个 函 
数 ， 但 无 论 如 何 通过 这 个 例子 我 们 很 好 地 演示 了 这 个 规则 。 

封装 (参考 6.6 节 ) 即 通过 在 程序 中 减少 对 数据 结构 的 非 预期 交互 ， 来 帮助 我 们 保证 数 
据 结构 中 的 不 变量 。 因 为 类 似 的 原因 ， 封 装 也 可 以 用 来 保持 并 发 中 的 不 变性 。 所 以 无 论 是 为 
了 保护 包 级 别 的 变量 ， 还 是 结构 中 的 字段 ， 当 你 使 用 一 个 互 斥 量 时 ， 都 请 确保 互 斥 量 本 身 以 
及 被 保护 的 变量 都 没有 导出 。 


9.3 读 与 互 斥 锁 : sync.RWMutex 


Bob 的 100 美元 存款 消失 了 ， 没 留 下 任何 线索 ，Bob 感到 很 焦虑 ， 为 了 解决 这 个 问题 ， 
Bob 写 了 一 个 程序 ， 每 秒 钟 查询 数 百 次 他 的 账户 余额 。 这 个 程序 同时 在 他 家 里 、 公 司 里 和 
他 的 手机 上 运行 。 银 行 注意 到 快速 增长 的 业务 请 求 正在 拖 慢 存 款 和 取款 操作 ， 因 为 所 有 的 
Balance 请 求 都 是 串 行 运行 的 ， 持 有 互 斥 锁 并 暂时 妨碍 了 其 他 goroutine 运行 。 

因为 Balance 函数 只 须 读 取 变量 的 状态 ， 所 以 多 个 Balance 请 求 其 实 可 以 安全 地 并 发 运 
行 ， 只 要 Deposit 和 withdraw 请 求 没有 同时 运行 即 可 。 在 这 种 场景 下 ， 我 们 需要 一 种 特殊 类 
型 的 锁 ， 它 允许 只 读 操作 可 以 并 发 执行 ， 但 写 操作 需要 获得 完全 独 享 的 访问 权限 。 这 种 锁 称 
为 多 读 单 写 锁 ，Go 语言 中 的 sync.RwMutex 可 以 提供 这 种 功能 : 


Vvar mu sync.RWMutex 
var balance int 


func Balance() int { 
mu.RLock() // 读 锁 
defer mu.RUnlock() 
return balance 


Balance 函数 现在 可 以 调用 RLock 和 Runlock 方法 来 分 别 获取 和 释放 一 个 读 锁 (也 称 为 共 
享 锁 )。Deposit 函数 无 须 更 改 ， 它 通过 调用 mu.Lock 和 mu.unlock 来 分 别 获 取 和 释放 一 个 写 锁 
(也 称 为 互 斥 锁 )。 

经 过 上 面 的 修改 之 后 ，Bob 的 绝 大 部 分 Balance 请 求 可 以 并 行 运行 且 能 更 快 完成 。 因 此 ， 
锁 可 用 的 时 间 比 例会 更 大 ，Deposit 请 求 也 能 得 到 更 及 时 的 响应 。 

RLock 仅 可 用 于 在 临界 区 域内 对 共享 变量 无 写 操作 的 情形 。 一 般 来 讲 ， 我 们 不 应 当 假 定 
那些 远 辑 上 只 读 的 函数 和 方法 不 会 更 新 一 些 变量 。 比 如 ， 一 个 看 起 来 只 是 简单 访问 器 的 方法 
可 能 会 递增 内 部 使 用 的 计数 器 ， 或 者 更 新 一 个 缓存 来 让 重复 的 调用 更 快 。 如 果 你 有 疑问 ， 那 
么 久 应 当 使 用 独 享 版 本 的 Lock。 

仅 在 绝 大 部 分 goroutine 都 在 获取 读 锁 并 且 锁 竞争 比较 激烈 时 ( 即 ，goroutine 一 般 都 需 
要 等 待 后 才能 获 到 锁 )，RwMutex 才 有 优势 。 因 为 RwMutex 需要 更 复杂 的 内 部 短 记 工作 ， 所 以 
在 竞争 不 激烈 时 它 比 普通 的 互 斥 锁 慢 。 


9.4 内 存 同步 


你 可 能 会 对 Balance 方法 也 需要 互 斥 锁 (不 管 是 基于 通道 的 锁 还 是 基于 互 斥 量 的 锁 ) 感 
到 奇怪 。 毕 竟 ， 与 Deposit 不 一 样 ， 它 只 包含 单个 操作 ， 所 以 并 不 存在 另外 一 个 goroutine 插 
在 中 间 执 行 的 风险 。 其 实 需要 互 斥 锁 的 原因 有 两 个 。 第 一 个 是 防止 Balance 插 到 其 他 操作 中 
间 也 是 很 重要 的 ， 比 如 withdraw。 第 二 个 原因 更 微妙 ， 因 为 同步 不 仅 涉 及 多 个 goroutine 的 
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执行 顺序 问题 ， 同 步 还 会 影响 到 内 存 。 

现代 的 计算 机 一 般 都 会 有 多 个 处 理 器 ， 每 个 处 理 器 都 有 内 存 的 本 地 缓存 。 为 了 提高 效 
率 ， 对 内 存 的 写 人 是 缓存 在 每 个 处 理 器 中 的 ， 只 在 必要 时 才 刷 回 内 存 。 甚 至 刷 回 内 存 的 顺序 
都 可 能 与 goroutine 的 写 人 顺序 不 一 致 。 像 通道 通信 或 者 互 斥 锁 操 作 这 样 的 同步 原 语 都 会 导 
致 处 理 器 把 累积 的 写 操作 刷 回 内 存 并 提交 ， 所 以 这 个 时 刻 之 前 goroutine 的 执行 结果 就 保证 
了 对 运行 在 其 他 处 理 器 的 goroutine 可 见 。 

考虑 如 下 代码 片段 的 可 能 输出 : 


var x, y int 


go func() { 
x=1 // Al 
fmt.Print("y:"; y, " ") // A2 
}() 
go func() { 
y=1 LAY ‘BE 
fm Prine( me Ke) B2 


}() 


由 于 这 两 个 goroutine 并 发 运行 且 在 没 使 用 互 斥 锁 的 情况 下 访问 共享 变量 ， 所 以 这 里 会 
有 数据 竞 态 。 于 是 我 们 对 程序 每 次 的 输出 不 一 样 不 应 该 感到 奇怪 。 根 据 对 程序 中 标注 语句 不 
同 的 交错 模式 ， 我 们 可 能 会 期 望 能 看 到 如 下 四 个 结果 中 的 一 个 : 


第 四 行 可 以 由 A1,B1,A2,B2 或 B1,A1,A2,B2 这 样 的 执行 顺序 来 产生 。 但 是 ， 程 序 产 生 的 如 
下 两 个 两 个 输出 就 在 我 们 的 意料 之 外 了 : 
:0 y:0 
:8 x:0 

但 在 某 些 特定 的 编译 器 、CPU 或 者 其 他 情况 下 ， 这 些 确实 可 能 发 生 。 上 面 四 个 语句 以 
什么 样 的 顺序 交错 执行 才能 解释 这 个 结果 呢 ? 

在 单个 goroutine 内 ， 每 个 语句 的 效果 保证 按照 执行 的 顺序 发 生 ， 也 就 是 说 ，goroutine 
是 串 行 一 致 的 (sequentially consistent)。 但 在 缺乏 使 用 通道 或 者 互 斥 量 来 显 式 同步 的 情况 下 ， 
并 不 能 保证 所 有 的 goroutine 看 到 的 事件 顺序 都 是 一 致 的。 尽管 goroutine 4 肯定 能 在 读 取 y 
之 前 能 观察 到 x=1 的 效果 ， 但 它 并 不 一 定 能 观察 到 goroutine 8B 对 y 写 人 的 效果 ， 所 以 4 可 
能 会 输出 y 的 一 个 过 期 值 。 

尽管 很 容易 把 并 发 简单 理解 为 多 个 goroutine 中 语句 的 某 种 交错 执行 方式 ,但 正如 上 面 
的 例子 所 显示 的 ， 这 并 不 是 一 个 现代 编译 器 和 CPU 的 工作 方式 。 因 为 赋值 和 Print 对 应 不 
同 的 变量 ， 所 以 编译 器 就 可 能 会 认为 两 个 语句 的 执行 顺序 不 会 影响 结果 ， 然 后 就 交换 了 这 
两 个 语句 的 执行 顺序 。CPU 也 有 类 似 的 问题 ， 如 果 两 个 goroutine 在 不 同 的 CPU 上 执行 ， 
每 个 CPU 都 有 自己 的 缓存 ， 那 么 一 个 goroutine 的 写 入 操作 在 同步 到 内 存 之 前 对 另外 一 个 
goroutine 的 Print 语句 是 不 可 见 的 。 

这 些 并 发 问题 都 可 以 通过 采用 简单 、 成 熟 的 模式 来 避免 ， 即 在 可 能 的 情况 下 ， 把 变量 限 
制 到 单个 goroutine 中 ， 对 于 其 他 变量 ， 使 用 互 斥 锁 。 
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9.5 ”延迟 初始 化 : sync.Once 


延迟 一 个 昂贵 的 初始 化 步骤 到 有 实际 需求 的 时 刻 是 一 个 很 好 的 实践 。 预 先 初始 化 一 个 变 
量 会 增加 程序 的 启动 延 时 ， 并 且 如 果实 际 执行 时 有 可 能 根本 用 不 上 这 个 变量 ， 那 么 初始 化 也 
不 是 必需 的 。 回 到 本 章 之 前 提 到 的 icons 变量 : 

var icons map[string]image.Image 


这 个 版 本 的 Icon 使 用 了 延迟 初始 化 : 
func loadIcons() { 
icons = map[string]image.Imagef{ 
"spades.png": loadIcon("spades.png"), 


"hearts.png": loadIcon("hearts.png"), 
"diamonds.png": loadIcon("diamonds.png"), 
"clubs.png": loadIcon("clubs.png"), 


} 
’ 
// 注意 : 并 发 不 安全 
func Icon(name string) image.Image { 
if icons == nil { 
loadIcons() // 一 次 性 地 初始 化 
} 


return icons[name] 


} 


对 于 那些 只 被 一 个 goroutine 访问 的 变量 ， 上 面 的 模式 是 没有 问题 的 ， 但 对 于 这 个 例子 ， 
在 并 发 调用 Icon 时 这 个 模式 就 是 不 安全 的 。 类 似 于 银行 例子 中 最 早 版 本 的 peposit 函数 ， 
Icon 也 包含 多 个 步骤 : 检测 icons 是 否 为 空 ， 再 加 载 图 标 ， 最 后 更 新 icons 为 一 个 非 nil 值 。 
直觉 可 能 会 告诉 你 ， 竞 态 带 来 的 最 严重 问题 可 能 就 是 10adIcons 哨 数 会 被 调用 多 遍 。 当 第 一 
个 goroutine 正 忙 于 加 载 图 标 时 ， 其 他 goroutine 进入 Icon 函数 ， 会 发 现 icons 仍然 是 nil， 
所 以 仍然 会 调用 loadIcons。 

但 这 个 直觉 仍然 是 错 的 (我 希望 你 现在 已 经 有 一 个 关于 并 发 的 新 直觉 ， 那 就 是 关于 并 
发 的 直觉 都 不 可 靠 )。 回 想 一 下 9.4 节 关 于 内 存 的 讨论 ， 在 缺乏 显 式 同步 的 情况 下 ， 编 译 带 
和 CPU 在 能 保证 每 个 goroutine 都 满足 串 行 一 致 性 的 基础 上 可 以 自由 地 重 排 访问 内 存 的 顺 
序 。1oadIcons 一 个 可 能 的 语句 重 排 结 果 如 下 所 示 。 它 在 填充 数据 之 前 把 一 个 空 map 赋 给 
icons : 


func loadIcons() { 
icons = make(map[string]image.Image) 
icons["spades.png"] = loadIcon("spades.png") 
icons["hearts.png"] = loadIcon("hearts.png") 
icons["diamonds.png"] = loadIcon("diamonds.png") 
icons["clubs.png"] = loadIcon("clubs.png") 

} 


因此 ， 一 个 -goroutine 发 现 icons 不 是 nil 并 不 意味 着 变量 的 初始 化 肯定 已 经 完成 。 
保证 所 有 goroutine 都 能 观察 到 loadIcons 效果 最 简单 的 正确 方法 就 是 用 一 个 互 斥 锁 来 做 
同步 : 


var mu sync.Mutex // 保护 icons 
var icons map[string]image.Image 
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// 并 发 安全 
func Icon(name string) image.Image { 
mu.Lock() 
defer mu.Unlock() 
if icons == nil { 
loadIcons() 


return icons[name] 


’ 

采用 互 斥 锁 访问 icons 的 额外 代价 是 两 个 goroutine 不 能 并 发 访问 这 个 变量 ， 即 使 在 变 
量 已 经 安全 完成 初始 化 且 不 再 更 改 的 情况 下 ， 也 会 造成 这 个 后 果 。 使 用 一 个 可 以 并 发 读 的 锁 
就 可 以 改善 这 个 问题 : 

var mu syne. RE // 保护 icons 


var icons map[string]image.Image 


// 并 发 安全 
func Icon(name string) image.Image { 
mu.RLock() 
if icons != nil { 
icon := icons[name] 
mu.RUnlock() 
return icon 


} 
mu.RUnlock() 


// 获取 互 斥 锁 

mu.Lock() 

if icons == nil { // 注意 : 必须 重新 检查 nil 值 
loadIcons() 

} 

icon := icons[name] 


mu.Unlock() 
return icon 


} 


这 里 有 两 个 临界 区 域 。goroutine 首先 获取 一 个 读 锁 ， 查 阅 map， 然 后 释放 这 个 读 锁 。 如 
果 条 目 能 找到 (常见 情况 )， 就 返回 它 。 如 果 条 目 没 找到 ，goroutine 再 获取 一 个 写 锁 。 由 于 
不 先 释 放 一 个 共享 锁 就 无 法 直接 把 它 升 级 到 互 斥 锁 ， 为 了 避免 在 过 渡 期 其 他 goroutine 已 经 
初始 化 了 icons， 所 以 我 们 必须 重新 检查 nil 值 。 

上 面 的 模式 具有 更 好 的 并 发 性 ， 但 它 更 复杂 并 且 更 容易 出 错 。 幸 运 的 是 ，sync 包 提 供 了 
针对 一 次 性 初始 化 问题 的 特 化 解决 方案 : sync.once。 从 概念 上 来 讲 ，once 包含 一 个 布尔 变量 
和 一 个 互 斥 量 ， 布 尔 变量 记录 初始 化 是 否 已 经 完成 ， 互 斥 量 则 负责 保护 这 个 布尔 变量 和 客户 
端的 数据 结构 。once 的 唯一 方法 pe 以 初始 化 函数 作为 它 的 参数 。 让 我 们 看 一 下 once 简化 后 
的 Icon 函数 


var loadIconsOnce sync.Once 
var icons map[string]image.Image 


// 并 发 安全 

func Icon(name string) image.image { 
loadIconsOnce.Do(loadIcons) 
return icons[name] 


} 
每 次 调用 po(loadIcons) 时 会 先 锁定 互 斥 量 并 检查 里 边 的 布尔 变量 。 在 第 一 次 调用 时 ， 
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这 个 布尔 变量 为 假 ，Do 会 调用 loadIcons 然后 把 变量 设置 为 真 。 后 续 的 调用 相当 于 空 操作 ， 
只 是 通过 互 斥 量 的 同步 来 保证 10adIcons 对 内 存 产生 的 效果 (在 这 里 就 是 icons 变量 ) 对 所 
有 的 goroutine 可 见 。 以 这 种 方式 来 使 用 sync.once， 可 以 避免 变量 在 正确 构造 之 前 就 被 其 他 
goroutine 分 享 。 

练习 9.2 : 重 写 2.6.2 节 的 popcount 示例 ， 使 用 sync.once 来 把 查找 表 的 初始 化 延迟 到 第 一 
次 使 用 时 。( 从 实际 效果 来 看 ， 像 Popcount 这 种 既 小 又 经 高 度 优化 的 函数 无 法 承担 同步 的 成 本 。) 


9.6 ” 竞 态 检测 器 

即使 以 最 大 努力 的 仔细 ， 仍 然 很 容易 在 并 发 上 犯错 误 。 幸 运 的 是 ，Go 语言 运行 时 和 工 
具 链 装备 了 一 个 精致 并 易于 使 用 的 动态 分 析 工 具 : 竞 态 检测 器 (race detector)。 

简单 地 把 -race 命令 行 参数 加 到 go build、go run 、go test 命令 里 边 即 可 使 用 该 功能 。 它 
会 让 编译 器 为 你 的 应 用 或 测试 构建 一 个 修改 后 的 版 本 ， 这 个 版 本 有 额外 的 手法 用 于 高 效 记 录 
在 执行 时 对 共享 变量 的 所 有 访问 ， 以 及 读 写 这 些 变量 的 goroutine 标识 。 除 此 之 外 ， 修 改 后 
的 版 本 还 会 记录 所 有 的 同步 事件 ， 包 括 go 语句 、 通 道 操作 、(*sync.Mutex) .Lock 调用 、(*sync. 
waitGroup) ,Wait 调用 等 。( 完 整 的 同步 事件 集合 可 以 在 语言 规范 中 的 “The Go Memory Model” 
文档 中 找到 。) 

竞 态 检 测 器 会 研究 事件 流 ， 找 到 那些 有 问题 的 案例 ， 即 一 个 goroutine 写 人 一 个 变量 
后 ， 中 间 没 有 任何 同步 的 操作 ， 就 有 另外 一 个 goroutine 读 写 了 该 变量 。 这 种 案例 表明 有 对 
共享 变量 的 并 发 访问 ， 即 数据 竞 态 。 这 个 工具 会 输出 一 份 报告 ， 包 括 变量 的 标识 以 及 读 写 
goroutine 当时 的 调用 栈 。 通 常情 况 下 这 些 信息 足以 定位 问题 了 。 在 9.7 节 就 有 一 个 竞 态 检测 
器 的 示例 。 

竞 态 检 测 器 报告 所 有 实际 运行 了 的 数据 竞 态 。 然 而 ， 它 只 能 检测 到 那些 在 运行 时 发 生 的 
竞 态 ， 无 法 用 来 保证 肯定 不 会 发 生 竞 态 。 为 了 获得 最 佳 效 果 ， 请 确保 你 的 测试 包含 了 并 发 使 
用 包 的 场景 。 

由 于 存在 额外 的 敌 记 工作 ， 带 竞 态 检测 功能 的 程序 在 执行 时 需要 更 长 的 时 间 和 更 多 的 内 
存 ， 但 即使 对 于 很 多 生产 环境 的 任务 ， 这 种 额外 开支 也 是 可 以 接受 的 。 对 于 那些 不 常 发 生 的 
竞 态 ， 使 用 竞 态 检测 器 可 以 帮 你 节省 数 小 时 甚至 数 天 的 调试 时 间 。 


9.7 示例 : 并 发 非 阻 塞 缓存 


在 本 节 中 ， 我 们 会 创建 一 个 并 发 非 阻塞 的 缓存 系统 ， 它 能 解决 在 并 发 实战 很 常见 但 已 有 
的 库 也 不 能 很 好 地 解决 的 一 个 问题 : 函数 记忆 ( memoizing) ?问题 ， 即 缓存 函数 的 结果 ， 达 
到 多 次 调用 但 只 须 计 算 一 次 的 效果 。 我 们 的 解决 方案 将 是 并 发 安全 的 ， 并 且 要 避免 简单 地 对 
整个 缓存 使 用 单个 锁 而 带 来 的 锁 争 夺 问 题 。 

我 们 将 使 用 下 面 的 httpGetBody 函数 作为 示例 来 演示 函数 记忆 。 它 会 发 起 一 个 HTTP 
GET 请 求 并 读 取 响 应 体 。 调 用 这 个 函数 相当 昂贵 ， 所 以 我 们 希望 避免 不 必要 的 重复 调用 。 


func httpGetBody(url string) (interface{}, error) { 
resp, err := http.Get(url) 
if err != nil { 
return nil, err 


} 


日 关于 函数 记忆 的 详细 信息 ， 可 以 参考 https://en.wikipedia.org/wiki/Memoization。 一 一 译 者 注 
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defer resp.Body.Close() 
return ioutil.ReadAll(resp.Body) 
} 


最 后 一 行 略 有 一 些微 妙 ，ReadAll 返回 两 个 结果 ， 一 个 []byte 和 一 个 error， 因 为 它们 分 
别 可 以 直接 赋 给 httpGetBody 声明 的 结果 类 型 interface{} 和 一 个 error， 所 以 我 们 可 以 直接 
返回 这 个 结果 而 不 用 做 额外 的 处 理 。httpGetBody 选择 这 样 的 结果 类 型 是 为 了 满足 我 们 要 做 
的 缓存 系统 的 设计 。 

下 面 是 缓存 的 初始 版 本 : 


Bopl.io/ch9/memol1 
// memo 包 提供 了 一 个 对 类 型 Func 并 发 不 安全 的 函数 记忆 功能 


package memo 


// Memo 缓 存 了 调用 Func 的 结果 
type Memo struct { 

下 Func 

cache map[string]result 


} 


// Func 是 用 于 记忆 的 函数 类 型 
type Func func(key string) (interface{}, error) 
type result struct { 

value interface{} 

err error 


} 


func New(f Func) *Memo { 
return &Memo{f: f, cache: make(map[string]result)} 


} 
// 注意 : 非 并 发 安全 


func (memo *Memo) Get(key string) (interface{}, error) { 
res, ok := memo.cache[key] 
if lok { 
res.value, res.err = memo.f(key) 
memo.cache[key] = res 
} 


return res.value, res.err 


} 


一 个 Memo 实例 包含 了 被 记忆 的 函数 f (类 型 为 Func)， 以 及 缓存 ， 类 型 为 从 字符 串 到 
result 的 一 个 映射 表 。 每 个 result 都 是 调用 f 产 生 的 结果 对 : 一 个 值 和 一 个 错误 。 在 设计 的 
推进 过 程 中 我 们 会 展示 Memo 的 几 种 变 体 ， 但 所 有 变 体 都 会 遵守 这 些 基本 概念 。 

下 面 的 例子 展示 如 何 使 用 Memo。 对 于 一 串 请 求 URL 中 的 每 个 元 素 ， 首 先 调用 et ， 记 
录 延 时 和 它 返 回 的 数据 长 度 : 


m := memo.New(httpGetBody) 
for url := range incomingURLs() { 
start := time.Now() 
value, err := m.Get(url) 
if err != nil { 
log.Print(err) 





fmt.Printf("%s, %s, %d bytes\n", 
url, time.Since(start), len(value.([]Jbyte))) 
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我 们 可 以 使 用 testing 包 (这 是 第 11 章 的 主题 ) edt ei 从 下 面 
的 测试 结果 来 看 ， 我 们 可 以 看 到 URL 流 有 重复 项 ， 尽 管 每 个 URL 第 一 次 调用 (*Memo) .Get 
都 会 消耗 数 百 毫 秒 的 时 间 ， 但 对 这 个 URL ee 1hs 内 就 返回 了 同样 的 结果 。 


$ go test -v gop1.io/ch9/memol 

=== RUN Test 
https://golang.org，175.626418ms，7537 bytes 
https://godoc.org, 172.686825ms, 6878 bytes 
https://play.golang.org, 115.762377ms, 5767 bytes 
http://gopl.io, 749.887242ms, 2856 bytes 
https://golang.org, 721ns, 7537 bytes 
https://godoc.org, 152ns, 6878 bytes 
https://play.golang.org, 205ns, 5767 bytes 
http://gopl.io, 326ns, 2856 bytes 

=-= PASS: Test (1.21s) 

PASS 

ok gopl.io/ch9/memol 1.257s 


这 次 测试 中 所 有 的 Get 都 是 串 行 运行 的 。 
因为 HTTP 请 求 用 并 发 来 改善 的 空间 很 大 ， 所 以 我 们 修改 测试 来 让 所 有 请 求 并 发 进行 。 
这 个 测试 使 用 sync.waitGroup 来 做 到 等 最 后 一 个 请 求 完成 后 再 返回 的 效果 。 


m := memo.New(httpGetBody) 
var n sync.WaitGroup 


for url := range incomingURLs() { 
n.Add(1) 
go func(url string) { 
start := time.Now() 
value, err := m.Get(url) 
if err != nil { 


log.Print(err) 


} 
fmt.Printf("%s, %s, %d bytes\n", 

url, time.Since(start), len(value.([]byte))) 
n.Done() 


}(url1) 


n.Wait() 


这 次 的 测试 运行 起 来 快 很 多 ,但 是 它 并 不 是 每 一 次 都 能 正常 运行 。 我 们 可 能 能 注意 到 意 
料 之 外 的 缓存 无 效 ， 以 及 缓存 命中 后 返回 错误 的 结果 ， 甚 至 甬 溃 。 

更 精 糕 的 是 ， ea st 所 以 我 们 可 能 甚至 都 没有 注意 到 它 会 有 问题 。 但 
如 果 我 们 加 上 -race 标志 后 再 运行 ， 那 么 竞 态 检测 器 (参考 9.6 节 ) 经 常会 输出 与 下 面 类 似 
的 一 份 报告 : 


$ go test -run=TestConcurrent -race -v gopl.io/ch9/memol 
=== RUN TestConcurrent 


WARNING: DATA RACE 
Write by goroutine 36: 
runtime.mapassign1() 
~/go/src/runtime/hashmap.g0:411 +6x6 
gopl.io/ch9/memo1.(*Memo).Get() 
~/gobook2/src/gopl.io/ch9/memo1/memo.g0:32 +6x265 


Previous write by goroutine 35: 
runtime.mapassign1() 
~/go/src/runtime/hashmap.go0:411 +6x6 
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gop1.io/ch9/memo1.(*Memo) .Get() 
~/gobook2/src/gopl.io/ch9/memol/memo.g80:32 +6X265 


Found 1 data race(s) 
FAIL gopl.io/ch9/memo1l 2.393s 


上 面 提 到 的 memo.go:32 告 诉 我 们 两 个 goroutine 在 没 使 用 同步 的 情况 下 更 新 了 cache 
map。 整 个 Get 函数 其 实 不 是 并 发 安全 的 : 它 存在 数据 兖 态 。 


28 func (memo *Memo) Get(key string) (interface{}, error) { 


29 res, ok := memo.cache[key] 

36 if lok { 

37 res.value, res.err = memo.f(key) 
32 memo.cache[key] = res 

33 . } 

34 return res.value, res.err 

35 } 


让 缓存 并 发 安全 最 简单 的 方法 就 是 用 一 个 基于 监控 的 同步 机 制 。 我 们 需要 的 是 给 emo 
加 一 个 互 斥 量 ， 并 在 et 函数 的 开头 获取 互 斥 锁 ， 在 返回 前 释放 互 斥 锁 ， 这 个 样 两 个 cache 
相关 的 操作 就 发 生 在 临界 区 域 了 : 


gopl1. io/ch9/memo2 
type Memo struct { 
下 Func 
mu sync.Mutex // 保护 cache 
cache map[string]result 


} 
// Get 是 并 发 安全 的 


func (memo *Memo) Get(key string) (value interface{}, err error) { 
memo .mu.Lock() 
res，ok := memo.cache[key] 
if !ok { 
res.value, res.err = memo.f(key) 
memo.cache[key] = res 


} 
memo.mu.Unlock() 
return res.value, res.err 
} 
现在 即使 并 发 运行 测试 ， 竞 态 检测 器 也 没有 报警 。 但 是 这 次 对 Memo 的 修改 让 我 们 之 
前 对 性 能 的 优化 失效 了 。 由 于 每 次 调用 f 时 都 上 锁 ， 因 此 Get 把 我 们 希望 并 行 的 IO 操作 
串 行 化 了 。 我 们 需要 的 是 一 个 非 阻 塞 的 缓存 ， 一 个 不 会 把 他 需要 记忆 的 函数 串 行 运行 的 
缓存 。 
在 下 面 一 个 版 本 的 6et 实现 中 ， 主 调 goroutine 会 分 两 次 获取 锁 : 第 一 次 用 于 查询 ， 第 
二 次 用 于 在 查询 无 返回 结果 时 进行 更 新 。 在 两 次 之 间 ， 其 他 goroutine 也 可 以 使 用 缓存 。 
gopl.io/ch9/memo3 
func (memo *Memo) Get(key string) (value interface{}, err error) { 
memo.mu.Lock() 


res, ok := memo.cache[key] 
memo.mu.Unlock() 
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if lok { 
res.value, res.err = memo.f(key) 
// 在 两 个 临界 区 域 之 前 ， 可 能 会 有 多 个 goroutine 来 计算 f(key) 并 且 
// 更 新 map 
memo.mu.Lock() 
memo.cache[key] = res 
memo.mu.Unlock() 


} 


return res.value, res.err 


} 

性 能 再 度 得 到 提升 ， 但 我 们 注意 到 某 些 URL 被 获取 了 两 次 。 在 两 个 或 者 多 个 goroutine 
几乎 同时 调用 et 来 获取 同一 个 URL 时 就 会 出 现 这 个 问题 。 两 个 goroutine 都 首先 查询 组 
存 ， 发 现 缓存 中 没有 需要 的 数据 ， 然 后 调用 那个 慢 函数 f， 最 后 又 都 用 获得 的 结果 来 更 新 
map ， 其 中 一 个 结果 会 被 另外 一 个 覆盖 。 

在 理想 情况 下 我 们 应 该 避免 这 种 额外 的 处 理 。 这 个 功能 有 时 称 为 重复 抑制 ( duplicate 
Suppression)。 在 下 面 的 Memo 版 本 中 ，map 的 每 个 元 素 是 一 个 指向 entry 结构 的 指针 。 除 了 
与 之 前 一 样 包含 一 个 已 经 记 住 的 函数 f 调用 结果 之 外 ， 每 个 entry 还 新 加 了 一 个 通道 ready。 
在 设置 entry 的 result 字段 后 ， 通 道 会 关闭 ， 正 在 等 待 的 goroutine 会 收 到 广播 (参考 8.9 
节 )， 然 后 就 可 以 从 entry 读 取 结果 了 。 

gopl1.io/ch9/memo4 

type entry struct { 

res result 


ready chan struct{} // res 准备 好 后 会 被 关闭 
} 


func New(f Func) *Memo { 
return &Memo{f: f, cache: make(map[string]*entry)} 


} 

type Memo struct { 
Func 
mu sync.Mutex // 保护 cache 
cache map[string]*entry 

} 


func (memo *Memo) Get(key string) (value interface{}, err error) { 
memo.mu.Lock() 
e := memo.cache[key] 
if e == nil { 
// 对 key 的 第 一 次 访问 ， 这 个 goroutine 负责 计算 数据 和 广播 数据 
// 已 准备 完毕 的 消息 
e = &entry{ready: make(chan struct{})} 
memo.cache[key] = e 
memo.mu.Unlock() 


e.res.value, e.res.err = memo.f(key) 


close(e.ready) // 广播 数据 已 准备 完毕 的 消息 
} else { 


// 对 这 个 key 的 重复 访问 

memo.mu.Unlock() 

<-e.ready // 等 待 数据 准备 完毕 
省 


return e.res.value，e.res.err 


小 
现在 调用 Get 回 会 先 获取 保护 cache map 的 互 斥 锁 ， 再 从 map 中 查询 一 个 指向 已 有 
entry 的 指针 ， 如 果 没 有 查找 到 ， 就 分 配 并 插入 一 个 新 的 entry， 最 后 释放 锁 。 如 果 要 查询 的 
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entry 存在 ， 那 么 它 的 值 可 能 还 没准 备 好 (另外 一 个 goroutine 有 可 能 还 在 调用 慢 函 数 f)， 所 
以 主 调 goroutine 就 需要 等 待 entry 准备 好 才能 读 取 entry 中 的 result 数据 ， 具体 的 实现 方法 
就 是 从 ready 通道 读 取 数 据 ， 这 个 操作 会 一 直 阻 塞 到 通道 关闭 。 

如 果 要 查询 的 entry 不 存在 ,那么 当前 的 goroutine 就 需要 新 插入 一 个 没有 准备 好 的 
entry 到 map 里 ， 并 负责 调用 慢 函 数 f， 更 新 entry， 最 后 向 其 他 正在 等 待 的 goroutine 广播 
数据 已 准备 完毕 的 消息 。 

注意 ，entry 中 的 变量 e.res.value 和 e.res.err 被 多 个 goroutine 共享 。 创 建 entry 的 
goroutine 设置 了 这 两 个 变量 的 值 ， 其 他 goroutine 在 收 到 数据 准备 完毕 的 广播 后 开始 读 这 
两 个 变量。 尽管 变量 被 多 个 goroutine 访问 ， 但 此 处 不 需要 加 上 互 斥 锁 。ready 通道 的 关闭 
先 于 其 他 goroutine 收 到 广播 事件 ， 所 以 第 一 个 goroutine 的 变量 写 人 事件 也 先 于 后 续 多 个 
goroutine 的 读 取 事件 。 在 这 个 情况 下 数据 竞 态 不 存在 。 

这 里 的 并 发 、 重 复 抑制 、 非 阻塞 缓存 就 完成 了 。 

上 面 的 Memo 代码 使 用 一 个 互 斥 量 来 保护 被 多 个 调用 Get 的 goroutine 访问 的 map 变量 。 
接 下 来 会 对 比 另外 一 种 设计 ， 在 新 的 设计 中 ，map 变量 限制 在 一 个 监控 goroutine 中 ， 而 Get 
的 调用 者 则 不 得 不 改 为 发 送 消息 。 

Func 、result 、entry 的 声明 与 之 前 一 致 : 


// Func 是 用 于 记忆 的 函数 类 型 
type Func func(key string) (interface{}, error) 


// result 是 调用 Func 的 返回 结果 
type result struct { 

value interface{} 

err error 


} 


type entry struct { 

res result 

ready chan struct{} // 当 res 准备 好 后 关闭 该 通道 
} 


尽管 Get 的 调用 者 通过 这 个 通道 来 与 监控 goroutine 通信 ， 但 是 Memo 类 型 现在 包含 一 
个 通道 requests。 该 通道 的 元 素 类 型 是 request。 通 过 这 种 数据 结构 ，Get 的 调用 者 向 监控 
goroutine 发 送 被 记忆 函数 的 参数 (key)， 以 及 一 个 通道 response， 结果 在 准备 好 后 就 通过 
response 通道 发 回 。 这 个 通道 仅 会 传输 一 个 值 。 


gopl1.io/ch9/memo5 
// request 是 一 条 请 求 消息 ，key 需要 用 Func 来 调用 
type request struct { 
key string 
response chan<- result // 客户 端 需要 单个 result 
} 


type Memo struct{ requests chan request } 


// New 返 回 千 的 函数 记忆 ， 客 户 端 之 后 需要 调用 Close. 
func New(f Func) *Memo { 
memo := &Memo{requests: make(chan request)} 
go memo.server(f) 
return memo 


} 


func (memo *Memo) Get(key string) (interface{}, error) { 
response := make(chan result) 
memo.requests <- request{key, response} 
res := <-response 
return res.value, res.err 


func (memo *Memo) Close() { close(memo.requests) } 
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上 面 的 Get 方法 创建 了 一 个 响应 (response) 通道 ， 放 在 了 请 求 里 边 ， 然 后 把 它 发 送 给 监 
控 goroutine， 再 马上 从 响应 通道 中 读 取 。 

如 下 所 示 ，cache 变量 被 限制 在 监控 goroutine ( 即 (*Memo) .server) 中 。 监 控 goroutine 
从 request 通道 中 循环 读 取 ， 直 到 该 通道 被 close 方法 关闭 。 对 于 每 个 请 求 ， 它 先 查 询 缓存 ， 
如 果 没 找到 则 创建 并 插入 一 个 新 的 entry。 


func (memo *Memo) server(f Func) { 


cache := make(map[string]*entry) 
for req := range memo.requests { 
e := Cache[req.key] 
if e == nil 


// 对 这 个 key 的 第 一 次 请 求 

e = &entry{ready: make(chan struct{})} 
cache[req.key] = e 

go e.call(f，req.key) // 调用 f(key) 


} 
go e.deliver(req.response) 
} 
func (e *entry) call(f Func, key string) { 
// 执行 函数 


e.res.value, e.res.err = f(key) 
// 通知 数据 已 准备 完毕 
close(e.ready) 


} 


func (e *entry) deliver(response chan<- result) { 
// 等 该 数据 准备 完毕 
<-e.ready 
// 向 客户 端 发 送 结果 
response <- e.res 


b 


与 基于 互 斥 锁 的 版 本 类 似 ， 对 于 指定 键 的 一 次 请 求 负责 在 该 键 上 调用 函数 f， 保 存 结果 
到 entry 中 ， 最 后 通过 关闭 ready 通道 来 广播 准备 完毕 状态 。 这 个 流程 通过 (*entry).call 来 
实现 。 

对 同一 个 键 的 后 续 请 求 会 在 map 中 找到 已 有 的 entry， 然 后 等 待 结 果 准 备 好 ， 最 后 通过 
响应 通道 把 结果 发 回 给 调用 Get 的 客户 端 goroutine。 其 中 call 和 deliver 方法 都 需要 在 独立 
的 goroutine 中 和 运行， 以 确保 监控 goroutine 能 持续 处 理 新 请 求 。 

上 面 的 例子 展示 了 可 以 使 用 两 种 方案 来 构建 并 发 结构 : 共享 变量 并 上 锁 ， 或 者 通信 顺序 
进程 (communicating sequential process)， 这 两 者 也 都 不 复杂 。 

在 给 定 的 情况 下 也 许 很 难 判定 哪 种 方案 更 好 ， 但 了 解 这 两 种 方案 的 对 照 关 系 是 很 有 价值 
的 。 有 时 候 从 一 种 方案 切换 到 另外 一 种 能 够 让 代码 更 简单 。 

练习 9.3: 扩展 Func 类 型 和 (*Memo) .Get 方法 ， 让 调用 者 可 选择 性 地 提供 一 个 done 通道 ， 
方便 取消 操作 (参考 8.9 节 )。 不 要 缓存 被 取消 的 Func 调用 结果 。 


9.8 goroutine 与 线程 


上 一 章 提 到 可 以 先 忽 略 goroutine 与 操作 系统 ( OS) 线程 的 差异 。 尽 管 它们 之 间 的 差异 
本 质 上 是 属于 量变 ， 但 一 个 足够 大 的 量变 会 变 成 质变 。 下 面 讨 论 如 何 区 分 它们 。 
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9.8.1 可 增长 的 栈 


每 个 OS 线程 都 有 一 个 固定 大 小 的 栈 内 存 (通常 为 2MB)， 栈 内 存 区 域 用 于 保存 在 其 他 
靖 数 调用 期 间 那 些 正在 执行 或 临时 暂停 的 函数 中 的 局 部 变量 。 这 个 固定 的 栈 大 小 既 太 大 又 太 
小 。 对 于 一 个 小 的 goroutine，2MB 的 栈 是 一 个 巨大 的 浪费 ， 比 如 有 的 goroutine 仅仅 等 待 一 
个 waitGroup 再 关闭 一 个 通道 。 在 Go 程序 中 ， 一 次 创建 十 万 左右 的 goroutine 也 不 罕见 ， 对 
于 这 种 情况 ， 栈 就 太 大 了 。 另 外 ， 对 于 最 复杂 和 深度 递归 的 函数 ， 固 定 大 小 的 栈 始 终 不 够 
大 。 改 变 这 个 固定 大 小 可 以 提高 空间 效率 并 允许 创建 更 多 的 线程 ， 或 者 也 可 以 容许 更 深 的 递 
归 函 数 ， 但 无 法 同时 做 到 上 面 的 两 点 。 

作为 对 比 ， 一 个 goroutine 在 生命 周期 开始 时 只 有 一 个 很 小 的 栈 ， 典 型 情况 下 为 2KB。 
与 0S 线程 类 似 ，goroutine 的 栈 也 用 于 存放 那些 正在 执行 或 临时 暂停 的 函数 中 的 局 部 变量 。 
但 与 OS 线程 不 同 的 是 ，goroutine 的 栈 不 是 固定 大 小 的 ， 它 可 以 按 需 增 大 和 缩小 。goroutine 
的 栈 大 小 限制 可 以 达到 1GB， 比 线程 典型 的 固定 大 小 栈 高 几 个 数量 级 。 当 然 ， 只 有 极 少 的 
goroutine 会 使 用 这 么 大 的 栈 。 

练习 9.4: 使 用 通道 构造 一 个 把 任意 多 个 goroutine 串联 在 一 起 的 流水 线程 序 。 在 内 存 耗 
尽 之 前 你 能 创建 的 最 大 流水 线 级 数 是 多 少 ” 一 个 值 穿 过 整个 流水 线 需要 多 久 ? 


9.8.2 goroutine 调度 


OS 线程 由 OS 内 核 来 调度 。 每 隔 几 毫秒 ， 一 个 硬件 时 钟 中 断 发 到 CPU，CPU 调用 一 个 
叫 调 度 器 的 内 核 函 数 。 这 个 函数 暂停 当前 正在 运行 的 线程 ， 把 它 的 寄存 器 信息 保存 到 内 存 ， 
查看 线程 列表 并 决定 接 下 来 运行 哪 一 个 线程 ， 再 从 内 存 恢复 线程 的 注册 表 信 息 ， 最 后 继续 执 
行 选中 的 线程 。 因 为 OS 线程 由 内 核 来 调度 ， 所 以 控制 权限 从 一 个 线程 到 另外 一 个 线程 需要 
一 个 完整 的 上 下 文 切 换 ( context switch) : 即 保存 一 个 线程 的 状态 到 内 存 ， 再 恢复 另外 一 个 
线程 的 状态 ， 最 后 更 新 调度 器 的 数据 结构 。 考 虑 这 个 操作 涉及 的 内 存 局 域 性 以 及 涉及 的 内 存 
访问 数量 ， 还 有 访问 内 存 所 需 的 CPU 周期 数量 的 增加 ， 这 个 操作 其 实 是 很 慢 的 。 

Go 运行 时 包含 一 个 自己 的 调度 器 ， 这 个 调度 器 使 用 一 个 称 为 m:n 调度 的 技术 (因为 它 
可 以 复 用 /调度 m 个 goroutine 到 nn 个 OS 线程 )。Go 调度 器 与 内 核 调度 器 的 工作 类 似 ,， 但 
Go 调度 器 只 需 关 心 单个 Go 程序 的 goroutine 调度 问题 。 

与 操作 系统 的 线程 调度 器 不 同 的 是 ，Go 调度 器 不 是 由 硬件 时 钟 来 定期 触发 的 ， 而 是 由 
特定 的 Go 语言 结构 来 触发 的 。 比 如 当 一 个 goroutine 调用 time.sleep 或 被 通道 阻塞 或 对 互 
斥 量 操作 时 ， 调 度 器 就 会 将 这 个 goroutine 设 为 休 眼 模式 ， 并 运行 其 他 goroutine 直到 前 一 个 
可 重新 唤醒 为 止 。 因 为 它 不 需要 切换 到 内 核 语 境 ， 所 以 调用 一 个 goroutine 比 调度 一 个 线程 
成 本 低 很 多 。 

练习 9.5: 写 一 个 程序 ， 两 个 goroutine 通过 两 个 无 缓冲 通道 来 互相 转发 消息 。 这 个 程序 
能 维持 每 秒 多 少 次 通信 ? 

9.8.3 GOMAXPROCS 

Go 调度 絮 使 用 6oMAXPRocs 参数 来 确定 需要 使 用 多 少 个 OS 线程 来 同时 执行 Go 代码 。 默 

认 值 是 机 器 上 的 CPU 数量 ， 所 以 在 一 个 有 8 个 CPU 的 机 器 上 ， 调度 器 会 把 Go 代码 同时 


调度 到 8 各 OS 线程 上 。( GoMAxPRocs 是 m:n 调度 中 的 n。) 正在 休眠 或 者 正 被 通道 通信 阻塞 
的 goroutine 不 需要 占用 线程 。 阻 塞 在 IO 和 其 他 系统 调用 中 或 调用 非 Go 语言 写 的 函数 的 
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goroutine 需要 一 个 独立 的 OS 线程 ， 但 这 个 线程 不 计算 在 6oMAXPROCS 内 。 
可 以 用 cowMaxpPRocs 环境 变量 或 者 runtime.6OMAXPROCS 函数 来 显 式 控 制 这 个 参数 。 可 以 用 
一 个 小 程序 来 看 看 GoMAxPRocs 的 效果 ， 这 个 程序 无 止境 地 输出 0 和 1: 


for { 
go fmt.Print(6) 
fmt.Print(1) 


$ GOMAXPROCS=1 go run hacker-cliché.go 
1111111111111111111166666666666666666866611111. . . 


$ GOMAXPROCS=2 go run hacker-cliché.go 
916161616161616161611661166161611616616166116. . . 


在 第 一 次 运行 时 ， 每 次 最 多 只 能 有 一 个 goroutine 运行 。 最 开始 是 主 goroutine， 它 输出 
1。 在 一 段 时 间 以 后 ，Go 调度 器 让 主 goroutine 休 眼 ， 并 且 唤 醒 另 一 个 输出 0 的 goroutine， 
让 它 有 机 会 执行 。 在 第 二 次 运行 时 ， 这 里 有 两 个 可 用 的 OS 线程 ， 所 以 两 个 goroutine 可 以 
同时 运行 ， 以 一 个 差不多 的 速率 输出 两 个 数字 。 我 们 必须 强调 影响 goroutine 调度 的 因素 很 
多 ， 运 行 时 也 在 不 断 演化 ， 所 以 你 的 结果 可 能 与 上 面 展 示 的 结果 会 有 所 不 同 。 

练习 9.6 : 测量 计算 密集 型 并 行程 序 ( 见 练习 8.5 ) 在 GoMAxPRocs 参数 变化 时 的 性 能 变 
化 。 在 你 的 计算 机 上 最 优 值 是 多 少 ? 你 的 计算 机 有 多 少 个 CPU? 


9.8.4 goroutine 没有 标识 


在 大 部 分 支持 多 线程 的 操作 系统 和 编程 语言 里 ， 当 前 线程 都 有 一 个 独特 的 标识 ， 它 通常 
可 以 取 一 个 整数 或 者 指针 。 这 个 特性 让 我 们 可 以 轻松 构建 一 个 线程 的 局 部 存储 ， 它 本 质 上 就 
是 一 个 全 局 的 map， 以 线程 的 标识 作为 键 ， 这 样 每 个 线程 都 可 以 独立 地 用 这 个 map 存储 和 
获取 值 ， 而 不 受 其 他 线程 干扰 。 

goroutine 没有 可 供 程 序 员 访 问 的 标识 。 这 个 是 由 设计 来 决定 的 ， 因 为 线程 局 部 存储 有 
一 种 被 滥用 的 倾向 。 比 如 ， 当 一 个 Web 服务 器 用 一 个 支持 线程 局 部 存储 的 语言 来 实现 时 ， 
很 多 函数 都 会 通过 访问 这 个 存储 来 查找 关于 HTTP 请 求 的 信息 。 但 就 像 那 些 过 度 依赖 于 全 局 
变量 的 程序 一 样 ， 这 也 会 导致 一 种 不 健康 的 “ 超 距 作 用 ”， 即 函数 的 行为 不 仅 取 决 于 它 的 参 
数 ， 还 取决 于 运行 它 的 线程 标识 。 因 此 ， 在 线程 的 标识 需要 改变 的 场景 (比如 需要 使 用 工作 
线程 时 )， 这 些 函 数 的 行为 就 会 变 得 诡异 莫 测 。 

Go 语言 鼓励 一 种 更 简单 的 编程 风格 ， 其 中 ， 能 影响 一 个 函数 行为 的 参数 应 当 是 显 式 指 
定 的 。 这 不 仅 让 程序 更 易 阅 读 ， 还 让 我 们 能 自由 地 把 一 个 函数 的 子 任务 分 发 到 多 个 不 同 的 
goroutine 而 无 需 担 心 这 些 goroutine 的 标识 。 

你 现在 已 经 学 习 了 写 Go 程序 所 需 的 所 有 语言 特性 。 在 接 下 来 的 两 章 中 ,我 们 将 回 退 一 
步 ， 从 一 个 更 大 的 尺度 去 了 解 支撑 编程 的 一 些 实践 和 工具 : 比如 如 何 把 一 个 项 目 分 为 多 个 
包 ， 如 何 获取 、 编 译 、 测 试 、 归 档 、 分 享 这 些 包 ， 以 及 对 这 些 包 进行 基准 测试 、 性 能 分 析 。 
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今天 一 个 中 等 规模 的 程序 可 能 包含 10 000 个 函数 。 但 是 作者 只 须 思考 它们 其 中 的 一 部 
分 ,其 至 不 需要 设计 函数 ， 因 为 绝 大 部 分 都 是 其 他 人 来 写 的 ， 然 后 通过 包 来 复 用 。 

Go 自 带 100 多 个 包 ， 可 以 为 大 多 数 应 用 程序 提供 基础 。Go 社区 是 一 个 苗 壮 成 长 的 生态 
环境 ， 其 中 鼓励 包 设 计 、 共 享 、 重 用 以 及 改进 ， 已 经 发 布 了 很 多 的 包 ， 可 以 在 http://godoc. 
org 找到 可 以 搜索 的 索引 。 本 章 展 示 如 何 使 用 已 有 的 包 和 创建 新 包 。 

Go 还 有 配套 的 go 工具 ， 一 个 复杂 但 是 容易 使 用 的 命令 行 工具 ， 用 来 管理 Go 包 的 工作 
空间 。 本 书 开篇 展示 了 如 何 使 用 go 工具 来 下 载 、 构 建 、 运 行 样 例 程序 。 本 章 讨论 这 个 工具 
所 隐 含 的 概念 ， 展 示 它 更 多 的 功能 ， 其 中 包括 输出 文档 和 在 包 的 工作 空间 中 查询 包 的 元 数 
据 。 下 一 章 探索 它 的 测试 特性 。 


10.1 引言 


任何 包 管理 系统 的 目的 都 是 通过 对 关联 的 特性 进行 分 类 ， 组 织 成 便于 理解 和 修改 的 单 
元 ， 使 其 与 程序 的 其 他 包 保 持 独 立 ， 从 而 有 助 于 设计 和 维护 大 型 的 程序 。 模 块 化 允许 包 在 不 
同 的 项 目 中 共享 、 复 用 ， 在 组 织 中 发 布 ， 或 者 在 全 世界 范围 内 使 用 。 

每 个 包 定义 了 一 个 不 同 的 命名 空间 作为 它 的 标识 符 。 每 个 名 字 关 联 一 个 具体 的 包 ， 它 让 
我 们 在 为 类 型 、 函 数 等 选取 短小 而 且 清晰 的 名 字 的 同时 ， 不 与 程序 的 其 他 部 分 冲突 。 

包 通 过 控制 名 字 是 否 导 出 使 其 对 包 外 可 见 来 提供 封装 能 力 。 限 制 包 成 员 的 可 见 性 ， 从 
而 隐藏 API 后 面 的 辅助 函数 和 类 型 ， 允 许 包 的 维护 者 修改 包 的 实现 而 不 影响 包 外 部 的 代码 。 
限制 变量 的 可 见 性 也 可 以 隐藏 变量 ， 这 样 使 用 者 仅 可 以 通过 导出 函数 来 对 其 访问 和 更 新 ， 他 
们 可 以 保留 自己 的 不 变量 以 及 在 并 发 程序 中 实现 互 斥 的 访问 。 

当 我 们 修改 一 个 文件 时 ， 我 们 必须 重新 编译 文件 所 在 的 包 和 所 有 潜在 依赖 它 的 包 。 众 所 
周知 ，Go 程序 的 编译 比 其 他 语言 要 快 ， 即 便 从 零 开 始 编译 也 如 此 。 这 里 有 三 个 主要 原因 。 
第 一 ， 所 有 的 导入 都 必须 在 每 一 个 源 文件 的 开头 进行 显 式 列 出 ， 这 样 编译 器 在 确定 依赖 性 的 
时 候 就 不 需要 读 取 和 处 理 整 个 文件 ; 第 二 ， 包 的 依赖 性 形成 有 向 无 环 图 ， 因 为 没有 环 ， 所 
以 包 可 以 独立 甚至 并 行 编 译 。 第 三 ，Go 包 编 译 输出 的 目标 文件 不 仅 记 录 它 自己 的 导出 信息 ， 
还 记录 它 所 依赖 包 的 导出 信息 。 当 编译 一 个 包 时 ， 编 译 器 必须 从 每 一 个 导入 中 读 取 一 个 目标 
文件 ， 但 是 不 会 超出 这 些 文件 。 


10.2 导入 路 径 
每 一 个 包 都 通过 一 个 唯一 的 字符 串 进行 标识 ， 它 称 为 导入 路 径 ， 它 们 用 在 import 声明 中 。 
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import ( 
"fmt" 
"math/rand" 
"encoding/json" 


"golang.org/x/net/html" 


"github.com/go-sql-driver/mysql" 


如 2.6.1 节 所 述 ，Go 语言 的 规范 没有 定义 字符 串 的 含义 或 如 何 确 定 一 个 包 的 导 人 路 径 ， 
它 通 过 工具 来 解决 这 些 问 题 。 本 章 详细 讨论 go 工具 如 何 理解 它们 ，go 工具 也 是 Go 程序 员 
用 来 构建 、 测 试 程序 的 主要 工具 ， 尽 管 还 有 其 他 工具 存在 。 例 如 ，Go 程序 员 使 用 Google 内 
部 的 多 语言 构建 系统 ， 遵 循 不 同 的 命名 和 包 定 位 规则 ， 具 体 化 的 测试 案例 等 ， 这 更 加 匹配 屠 
个 系统 的 惯例 。 

对 于 准备 共享 或 公开 的 包 ， 导 和 路径 需 要 全 局 唯一 。 为 了 避免 冲突 ， 除 了 标准 库 中 的 包 
之 外 ， 其 他 包 的 导入 路 径 应 该 以 互联 网 域名 (组 织 机 构 拥 有 的 域名 或 用 于 存放 包 的 域名 ) 作 
为 路 径 开 始 ， 这 样 也 方便 查找 包 。 例 如 上 面 例子 导入 Go 团队 维护 的 一 个 HTML 解析 器 和 一 
个 流行 的 第 三 方 MySQL 数据 库 驱 动 程序 。 


10.3” 包 的 声明 


在 每 一 个 Go 源 文件 的 开头 都 需要 进行 包 声明 。 主 要 的 目的 是 当 该 包 被 其 他 包 引 入 的 时 
候 作 为 其 默认 的 标识 符 〈 称 为 包 名 )。 

例如 ，math/rand 包 中 每 一 个 文件 的 开头 都 是 package rand， 这 样 当 你 导 和 人 这 个 包 时 ， 可 
以 访问 它 的 成 员 ， 比 如 rand.Int、rand.Float64 等 。 

package main 


import ( 
"fmt" 
"math/rand" 
) 


func main() { 

fmt.Println(rand.Int()) 

} 

通常 ， 包 名 是 导入 路 径 的 最 后 一 段 ， 于 是 ， 即 使 导入 路 径 不 同 的 两 个 包 ， 二 者 也 可 以 拥 
有 同样 的 名 字 。 例 如 ， 两 个 包 的 导入 路 径 分 别 是 math/rand 和 crypto/rand， 而 包 的 名 字 都 是 
rand。 我 们 将 看 到 如 何在 同一 个 程序 中 同时 使 用 它们 。 

关于 “最 后 一 段 ” 的 惯例 ， 这 个 有 三 个 例外 。 第 一 个 例外 是 : 不 管 包 的 导入 路 径 是 什么 ， 
如 果 该 包 定义 一 条 命令 (可 执行 的 Go 程序 )， 那 么 它 总 是 使 用 名 称 main。 这 是 告诉 go build 
( 见 10.7.3 节 ) 的 信号 ， 它 必须 调用 连接 器 生成 可 执行 文件 。 

第 二 个 例外 是 : 目录 中 可 能 有 一 些 文件 名 字 以 _test.go 结尾 ， 包 名 中 会 出 现 以 -test 结 
尾 。 这 样 一 个 目录 中 有 两 个 包 : 一 个 普通 的 ， 加 上 一 个 外 部 测试 包 。_test 后 缀 告诉 go test 
两 个 包 都 需要 构建 ， 并 且 指 明文 件 属 于 哪个 包 。 外 部 测试 包 用 来 避免 测试 所 依赖 的 导入 图 中 
的 循环 依赖 。11.2.4 节 会 进行 更 细致 的 讲述 。 

第 三 个 例外 是 : 有 一 些 依赖 管理 工具 会 在 包 导 入 路 径 的 尾部 追加 版 本 号 后 级， 如 
"gopkg.in/yaml.v2"。 包 名 不 包含 后 级 ， 因 此 这 个 情况 下 包 名 为 yaml。 
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10.4 导入 声明 

一 个 Go 源 文件 可 以 在 package 声明 的 后 面 和 第 一 个 非 导入 声明 语句 前 面 紧 接 着 包含 零 
个 或 多 个 import 声明 。 每 一 个 导入 可 以 单独 指定 一 条 导入 路 径 ， 也 可 以 通过 圆 括号 括 起 来 
的 列表 一 次 导入 多 个 包 。 下 面 两 种 形式 是 等 价 的 ， 但 第 二 种 形式 更 常见 。 


import "fmt" 
import "os" 





import ( 
"fmt" 
ios 


) 
导入 的 包 可 以 通过 空 行进 行 分 组 ; 这 类 分 组 通常 表示 不 同 领域 和 方面 的 包 。 导 入 顺序 不 


重要 ， 但 按照 惯例 每 一 组 都 按照 字母 进行 排序 。( gofmt 和 goimports 工具 都 会 自动 进行 分 组 
并 排序 。) | 
import ( 
"fmt" 
"html/template" 


"os" 


"golang.org/x/net/html" 
"golang.org/x/net/ipv4" 
) 


如 果 需 要 把 两 个 名 字 一 样 的 包 (如 math/rand 和 crypto/rand) 导入 到 第 三 个 包 中 ， 导 入 
声明 就 必须 至 少 为 其 中 的 一 个 指定 一 个 替代 名 字 来 避免 冲突 。 这 叫 作 重 命名 导入 。 

import ( 

"crypto/rand" 

, mrand "math/rand”// 通过 指定 一 个 不 同 的 名 称 mrand 就 避免 了 冲突 

替代 名 字 仅 影响 当前 文件 。 其 他 文件 (即便 是 同一 个 包 中 的 文件 ) 可 以 使 用 默认 名 字 来 
导入 包 ， 或 者 一 个 替代 名 字 也 可 以 。 

重 命名 导入 在 没有 冲突 时 也 是 非常 有 用 的 。 如 果 有 时 用 到 自动 生成 的 代码 ， 导 入 的 包 名 
字 非 常 元 长 ， 使 用 一 个 替代 名 字 可 能 更 方便 。 同 样 的 缩写 名 字 要 一 直 用 下 去 ， 以 避免 产生 混 
消 。 使 用 一 个 替代 名 字 有 助 于 规避 常见 的 局 部 变量 冲突 。 例 如 ， 如 果 一 个 文件 可 以 包含 许多 
以 path 命名 的 变量 ， 我 们 就 可 以 使 用 pathpkg 这 个 名 字 导 入 一 个 标准 的 "path" 包 。 

每 个 导入 声明 从 当前 包 向 导入 的 包 建 立 一 个 依赖 。 如 果 这 些 依赖 形成 一 个 循环 ，go 
build 工具 会 报错 。 


10.5 ” 空 导 入 


如 果 导 和 的 包 的 名 字 没 有 在 文件 中 引用 ， 就 会 产生 一 个 编译 错误 。 但 是 ， 有 时 候 ， 我 们 
必须 导 和 人 一 个 包 ， 这 仅仅 是 为 了 利用 其 副作用 : 对 包 级 别 的 变量 执行 初始 化 表达 式 求 值 ， 并 
执行 它 的 init 函数 ( 见 2.6.2 节 )。 为 了 防止 “未 使 用 的 导入 ”错误 ， 我 们 必须 使 用 一 个 重 
命名 导 和 人 ， 它 使 用 一 个 替代 的 名 字 _， 这 表示 导入 的 内 容 为 空白 标识 符 。 通 常情 况 下 ， 空 白 
标识 不 可 能 被 引用 。 

import _ "image/png"”// 注册 PNG 解码 器 

这 称 为 空白 导入 。 多 数 情况 下 ， 它 用 来 实现 一 个 编译 时 的 机 制 ， 使 用 空白 引用 导入 人 额外 
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的 包 ， 来 开启 主 程序 中 可 选 的 特性 。 首 先 我 们 来 看 如 何 使 用 它 ， 然 后 看 它 是 如 何 工作 的 。 

标准 库 的 image 包 导 出 了 Decode 函数 ， 它 从 io.Reader 读 取 数 据 ， 并 且 识 别 使 用 哪 一 种 图 
像 格 式 来 编码 数据 ， 调 用 适当 的 解码 器 ， 返 回 image.Image 对 象 作 为 结果 。 使 用 image.Decode 
可 以 构建 一 个 简单 的 图 像 转换 器 ， 读 取 某 一 种 格式 的 图 像 ， 然 后 输出 为 另外 一 个 格式 : 


&opl.io/ch16/TJpeg 
// jpeg 命令 从 标准 输入 读 取 PNG 图 像 
// 并 把 它 作为 JPEG 图 像 写 到 标准 输出 


package main 


import ( 
-Fe 
"image" 
"image/jpeg" 
_ "image/png”// 注册 PNG 解码 器 
“io" 
"os" 


) 


func main() { 
if err := toJPEG(os.Stdin, os.Stdout); err != nil { 
fmt.Fprintf(os.Stderr, "jpeg: %v\n", err) 


os.Exit(1) 
} 
} 
func toJPEG(in io.Reader, out io.Writer) error { 
img, kind, err := image.Decode(in) 
if err != nil { 


return err 


fmt.Fprintln(os.Stderr, "Input format =", kind) 
return jpeg.Encode(out, img, &jpeg.Options{Quality: 95}) 
} 


如 果 将 gop1.io/ch3/mandelbrot (参考 3.3 节 ) 的 输出 作为 这 个 转换 程序 的 输入 ， 它 检测 
PNG 个 数 的 输入 ， 然 后 输出 JPEG 格式 的 图 3-3。 


$ go build gopl.io/ch3/mandelbrot 

$ go build gopl.io/ch18/jpeg 

$ ./mandelbrot | ./jpeg >mandelbrot.jpg 
Input format = png 


注意 空白 导入 image/png。 没 有 这 一 行 ， 程 序 可 以 正常 编译 和 链接 ,但 是 不 能 识别 和 解 
码 PNG 格式 的 输入 : 


$ go build gopl.io/ch1i6/jpeg 
$ ./mandelbrot | ./jpeg >mandelbrot.jpg 
jpeg: image: unknown format 


这 里 解释 它 是 如 何 工 作 的 。 标 准 库 提供 GIF、PNG、JPEG 等 格式 的 解码 库 ， 用 户 自 己 
可 以 提供 其 他 格式 的 ， 但 是 为 了 使 可 执行 程序 简短 ， 除 非 明 确 需要 ， 否 则 解码 器 不 会 被 包 
含 进 应 用 程序 。image.Decode 函数 查阅 一 个 关于 支持 格式 的 表格 。 每 一 个 表 项 由 4 个 部 分 组 
成 : 格式 的 名 字 ; 某 种 格式 中 所 使 用 的 相同 的 前 缀 字符 串 ， 用 来 识别 编码 格式 ; 一 个 用 来 
解码 被 编码 图 像 的 函数 Decode ; 以 及 另 一 个 函数 pecodeconfig， 它 仅仅 解码 图 像 的 元 数据 ， 
比如 尺寸 和 色 域 。 对 于 每 一 种 格式 ， 通 常 通过 在 其 支持 的 包 的 初始 化 函数 中 来 调用 image. 
RegisterFormat 来 向 表格 添加 项 ， 例 如 image/png 中 的 实现 如 下 : 
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package png // image/png 


func Decode(r io.Reader) (image.Image, error) 
func DecodeConfig(r io.Reader) (image.Config, error) 


func init() { 
const pngHeader = "\x89PNG\r\n\xla\n" 
image.RegisterFormat("png", pngHeader, Decode, DecodeConfig) 
} 
这 个 效果 就 是 ， 一 个 应 用 只 需要 空白 导入 格式 化 所 需 的 包 ， 就 可 以 让 image.Decode 函数 
具备 应 对 格式 的 解码 能 力 。 
database/sql 包 使 用 类 似 的 机 制 让 用 户 按 需 加 入 想 要 的 数据 库 驱 动 程序 。 例 如 : 


import ( 
"database/sql" 
_ "github.com/lib/pq" // 添加 Postgres 支持 
_ "github.com/go-sql-driver/mysql"”// 添加 MySQL 支持 

) 


db, err = sql.Open("postgres", dbname) // OK 
db, err = sql.Open("mysql", dbname) // OK 
db，err = sql.Open("sqlite3",，dbname) // 返回 错误 消息 : unknown driver "sqlite3" 


练习 10.1 : 扩展 jpeg 程序 ， 使 其 可 以 把 任意 支持 的 输入 格式 转换 为 任意 输出 格式 ， 使 
用 image.Decode 来 检测 输入 格式 ， 并 且 添 加 一 个 标记 来 选择 输出 格式 。 

练习 10.2 : 定义 一 个 通用 的 归档 文件 读 取 函数 ， 它 可 以 读 取 ZIP ( archive/zip) 文件 和 
POSIX tar ( archive/tar) 文件 。 使 用 一 个 类 似 前 面 描述 的 注册 机 制 ， 使 用 空白 导入 以 插件 方 
式 支持 各 种 文件 格式 。 


10.6 包 及 其 命名 

本 节 将 提供 一 些 建议 ， 指 出 如 何 遵从 Go 的 习惯 来 给 包 和 它 的 成 员 进行 命名 。 

当 创建 一 个 包 时 ， 使 用 简短 的 名 字 ， 但 是 不 要 短 到 像 加 了 密 一 样 。 在 标准 库 中 最 常用 的 
包 包 括 : bufio、bytes、flag、fmt、http、io、json、os、sort、sync 和 time 等 。 

尽 可 能 保持 可 读 性 和 无 歧义 。 例 如 ， 不 要 把 一 个 辅助 工具 包 命 名 为 util， 使 用 
imageutil 或 ioutil 等 名 称 更 具体 和 清晰 。 避 免 选 择 经 常用 于 相关 的 局 部 变量 的 包 名 ， 或 者 
迫使 使 用 者 使 用 重 命名 导入 ， 例 如 使 用 以 path 命名 的 包 。 

包 名 通常 使 用 统一 的 形式 。 标 准 包 bytes 、errors 和 strings 使 用 复数 来 避免 覆盖 响应 的 
预 声 明 类 型 ， 使 用 go/types 这 个 形式 ,来 避免 和 关键 字 的 冲突 。 

避免 使 用 有 其 他 含义 的 包 名 。 例 如 ， 我 们 一 开始 在 2.5 节 中 使 用 temp 作为 温度 转换 包 的 
名 字 ， 但 是 它 没有 继续 这 么 用 。 这 是 一 个 非常 糟糕 的 主意 ， 因 为 “temp” 大 多 数 情况 下 代表 
“temporary”( 临 时 性 的 )。 我 们 在 一 小 段 时 间 里 面 使 用 temperature 作为 包 名 ， 但 是 它 太 长 了 ， 
并 且 不 能 说 明 它 究竟 可 以 做 什么 。 最 后 ， 它 变 成 了 tempconv， 它 更 短 并 且 和 strconv 等 类 似 。 

现在 讨论 包 成 员 的 命名 。 因 为 对 其 他 包 成 员 的 每 一 个 引用 使 用 一 个 具体 的 标识 符 ， 例 如 
fmt.Println， 描 述 包 的 成 员 和 描述 包 名 与 成 员 名 同样 繁杂 。 我 们 不 需要 在 Println 中 引用 格 
式 化 的 概念 ， 因 为 包 名 fmt 还 没有 准备 好 。 当 设计 一 个 包 时 ， 要 考虑 两 个 有 意义 的 部 分 如 何 
一 起 工作 ， 而 不 只 是 成 员 名 。 这 里 有 一 些 具体 的 例子 : 


bytes. Equal flag.Int http.Get json.Marshal 


我 们 可 以 识别 出 一 些 通用 的 命名 模式 。strings 包 提供 一 系列 操作 字符 串 的 独立 函数 : 
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package strings 


func Index(needle，haystack string) int 


type Replacer struct{ /* ... */ } 
func NewReplacer(oldnew ...string) *Replacer 
type Reader struct{ /+ ... */ } 


func NewReader(s string) *Reader 


string 这 个 词 不 会 出 现在 任何 名 字 中 。 客 户 通过 strings.Index、strings.Replacer 等 引 
用 它们 。 

其 他 的 一 些 包 可 以 描述 为 单一 类 型 包 ， 例 如 html/template 和 math/rand， 这 些 包 导出 一 
个 数据 类 型 及 其 方法 ， 通 常 有 一 个 Nen 函数 用 来 创建 实例 。 

package rand // "math/rand" 


type Rand struct{ /* ... */ } 
func New(source Source) *Rand 


这 可 能 造成 重复 ， 例 如 在 template.Template 或 rand.Rand 中 ， 这 也 是 为 什么 这 类 包 名 通 
常 都 比较 短 。 

在 其 他 极端 情况 下 ， 像 net/http 这 样 的 包 有 很 多 的 名 字 ， 但 是 没有 很 多 的 结构 ， 因 为 它 
们 执行 复杂 的 任务 。 尽 管 有 超过 20 种 类 型 和 更 多 的 函数 ， 但 是 包 中 最 重要 的 成 员 使 用 最 简 


单 的 命名 : Get 、Post 、Handle、Error 、Client 、Server。 


10.7 go 工具 
下 面 的 章节 主要 讨论 go 工具 ( go tool)， 它 用 来 下 载 、 查 询 、 格 式 化 、 构 建 、 测 试 以 及 
安装 Go 代码 包 。 


go 工具 将 不 同 种 类 的 工具 集合 并 为 一 个 命名 集 。 它 是 一 个 包 管理 器 (类似 于 apt 或 
rpm)， 它 可 以 查询 包 的 作者 ， 计 算 它 们 的 依赖 关系 ， 从 远程 版 本 控制 系统 下 载 它们 。 它 是 一 
个 构建 系统 ， 可 计算 文件 依赖 ， 调 用 编译 器 、 汇 编 器 和 链接 器 ， 尽 管 它 没 有 标准 的 UNIX 
make 命令 完备 。 它 还 是 一 个 测试 驱动 程序 ， 第 11 章 将 介绍 它 。 

它 的 命令 行 接口 使 用 “瑞士 军刀 ”风格 ， 有 十 几 个 子 命 令 ， 其 中 有 一 些 我 们 已 经 见 过 ， 
例如 get、run、build 和 fmt。 可 以 运行 go help 来 查看 内 置 文档 的 索引 。 仅 仅 为 了 引用 ,我 
们 已 经 列 出 了 最 常用 的 命令 : 


$ go 
build compile packages and dependencies 
clean remove object files 
doc show documentation for package or symbol 
env print Go environment information 
fmt run gofmt on package sources 
get download and install packages and dependencies 
install compile and install packages and dependencies 
list list packages 
run compile and run Go program 
test test packages 
version print Go version 
vet run go tool vet on packages 


Use "go help [command]" for more information about a command. 
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为 了 让 配置 操作 最 小 化 ，go 工具 非常 依 惯例 。 例 如 ， 给 定 一 个 Go 源 文件 ， 该 工具 可 
以 找到 它 所 在 的 包 ， 因 为 每 一 个 目录 包含 一 个 包 ， 并 且 包 的 导入 路 径 对 应 于 工作 空间 的 目录 
结构 。 给 定 一 个 包 的 导 和 路径， 该 工具 可 以 找到 存放 目标 文件 的 对 应 目录 。 它 也 可 以 找到 存 
储 源 代码 仓库 的 服务 器 的 URL。 


10.7.1 工作 空间 的 组 织 


大 部 分 用 户 必须 进行 的 唯一 的 配置 是 GopaTH 环境 变量 ， 它 指定 工作 空间 的 根 。 当 需要 
切换 到 不 同 的 工作 空间 时 ， 更 新 GoPATH 变量 的 值 即 可 。 例 如 ， 当 写 这 本 书 的 时 候 ， 我 们 设 


置 GoPATH 为 $HOME/gobook: 


$ export GOPATH=$HOME/gobook 
$ go get gopl.io/... 


在 你 使 用 上 面 的 命令 下 载 了 本 书 所 有 的 程序 之 后 ， 你 的 工作 空间 将 包含 如 下 一 个 层次 
结构 : 


GOPATH/ 
src/ 
gopl.io/ 
.git/ 
ch1/ 
helloworld/ 
main.go 
dup/ 
main.go 


golang.org/x/net/ 
.git/ 
html/ 
parse.go 
node.go 
bin/ 
helloworld 
dup 
pkg/ 
darwin_amd64/ 





GOPATH 有 三 个 子 目录 。src 子 目录 包含 源 文件 。 每 一 个 包 放 在 一 个 目录 中 ， 该 目录 相对 
于 $GOPATH/src 的 名 字 是 包 的 导入 路 径 ， 如 gopl.io/chl/hellowor1d。 注 意 ， 一 个 GoPATH 工作 
空间 在 src 下 包含 多 个 源 代 码 版 本 控制 仓库 ， 例 如 gop1.io 或 golang.org。pkg 子 目录 是 构建 
工具 存储 编译 后 的 包 的 位 置 ，bin 子 目录 放置 像 nellowor1d 这 样 的 可 执行 程序 。 

第 二 个 环境 变量 是 GoR00T， 它 指定 Go 发 行 版 的 根 目录 ， 其 中 提供 所 有 标准 库 的 包 。 
GOROOT 下 面 的 目录 结构 类 似 于 GoPATH， 这 样 fmt 包 的 源 代码 放 在 #6oRooT/src/fmt 目录 中 。 用 
户 无 须 设 置 6oR00T， 因 为 默认 情况 下 go 工具 使 用 它 的 安装 路 径 。 

go env 命令 输出 与 工具 链 相 关 的 已 经 设置 有 效 值 的 环境 变量 及 其 所 设置 值 ， 还 会 输出 未 
设置 有 效 值 的 环境 变量 及 其 默认 值 。Goos 指定 目标 操作 系统 (例如 ，android、1linux 、darwin 
或 者 windows )，GOARCH 指定 目标 处 理 器 架构 ， 比 如 amd64、386 或 arm。 尽 管 GoPATH 是 为 一 个 
必须 设置 的 变量 ,但 是 其 他 的 变量 也 会 偶尔 在 我 们 的 解释 中 出 现 。 
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$ go env 

GOPATH=" /home/gopher/gobook" 
GOROOT="/usr/local/go" 
GOARCH="amd64" 

GOOS="darwin" 


10.7.2 包 的 下 载 


如 果 使 用 go 工具 ， 包 的 导入 路 径 不 仅 指 示 了 如 何在 本 地 工作 空间 中 找到 它 的 位 置 ， 还 
明了 通过 互联 网 使 用 go get 来 获取 和 更 新 它 的 位 置 。 

go get 命令 可 以 下 载 单一 的 包 ， 也 可 以 使 用 .… 符号 来 下 载 子 树 或 仓库 , 像 前 一 市 提 
到 的 那样 。 该 工具 也 计算 并 下 载 初始 包 所 有 的 依赖 性 ， 这 也 是 为 什么 前 一 个 例子 中 golang. 
org/x/net/html 包 会 出 现在 工作 空间 中 。 

在 go get 完成 包 的 下 载 之 后 ， 它 会 构建 它们 ， 然 后 安装 库 和 相应 的 命令 。 这 些 内 容 会 
在 下 一 节 详 细 讨 论 ， 一 个 例子 将 展示 整个 流程 是 如 何 进行 的 。 下 面 的 第 一 条 命令 获取 golint 
工具 ， 它 用 来 检查 Go 源码 中 的 风格 问题 。 第 二 条 命令 执行 golint 来 检查 2.6.2 节 中 的 gop1. 
io/ch2/popcount 代码 。 它 会 报告 我 们 忘 了 给 这 个 包 写 文档 注释 : 


$ go get github.com/golang/lint/golint 
$ $GOPATH/bin/golint’ gopl.io/ch2/popcount 
src/gopl.io/ch2/popcount/main.go:1:1: 

package comment should be of the form "Package popcount ..." 


go get 命令 已 经 支持 多 个 流行 的 代码 托管 站 点 ， 如 Github 、Bitbucket 和 Launchpad， 并 
且 可 以 向 版 本 控制 系统 发 出 合适 的 请 求 。 对 于 不 知名 的 网 站 ， 你 也 许 需要 指出 导入 路 径 使 用 
的 是 哪 种 版 本 控制 协议 ， 比 如 Git 或 Mercurial。 执 行 go help importpath 来 获取 更 多 细节 。 

go get 创建 的 目录 是 远程 仓库 的 真实 客户 端 ， 而 不 仅仅 是 文件 的 副本 ， 这 样 可 以 使 用 版 
本 控制 命令 来 查看 本 地 编辑 的 差异 或 者 更 新 到 不 同 的 版 本 。 例 如 ，golang.org/x/net 目录 是 
一 个 Git 客户 端 : 

$ cd $GOPATH/src/golang.org/x/net 

$ git remote -v 


origin https://go.googlesource.com/net (fetch) 
origin https://go.googlesource.com/net (push) 


注意 ， 包 导入 路 径 中 明显 的 域名 (golang.org) 不 同 于 Git 服 务 器 的 实际 域名 
(go.googlesource.com)。 这 是 go 工具 的 一 个 特性 ， 如 果 位 置 由 诸如 googlesource.com 或 github. 
com 之 类 通用 服务 托管 ， 包 可 以 在 其 导 和 人 路径 中 使 用 自 定义 域名 。 在 https://golang.org/x/ 
net/html 下 面 的 HTML 网 页 包含 如 下 元 数据 ， 它 重 定向 go 工具 到 实际 托管 地 址 的 Git 仓库 : 


$ go build gopl.io/ch1i/fetch 
$ ./fetch https://golang.org/x/net/htm]l | grep go-import 
<meta name="go-import" 
content="golang.org/x/net git https://go.googlesource.com/net"> 


如 果 你 指定 -u 开关 ，go get 将 确保 它 访问 的 所 有 包 (包括 它们 的 依赖 性 ) 更 新 到 最 新 版 
本 ， 然 后 再 构建 和 按照 。 如 果 没有 这 个 标记 ， 已 经 存在 于 本 地 的 包 不 会 更 新 。 

go get -u 命令 通常 获取 每 个 包 的 最 新 版 本 ， 它 在 你 刚刚 开始 的 时 候 很 方便 ; 但 是 在 需 
要 部 署 的 项 目 中 (其 中 ， 发 布 版 本 需要 精准 的 版 本 控制 )， 就 不 太 适 合 使 用 它 。 通 常 的 解决 
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方案 是 加 一 层 vendor 目录 ， 构 建 一 个 关于 所 有 必需 依赖 的 本 地 副本 ， 然 后 非常 小 心地 更 新 
这 个 副本 。 在 Go 1.5 之 前 ， 这 需要 改变 包 的 导 和 路径， 这 样 golang.org/x/net/html 的 副本 
会 变 成 gopl.io/vendor/golang.org/x/net/html。 几 乎 所 有 最 近 版 本 的 go 工具 都 支持 加 vendor 
目录 ， 但 这 里 不 允许 我 们 展开 所 有 的 细节 了 。 请 使 用 go help gopath 来 查看 vendor 目录 的 详 
细 信 息 。 

练习 10.3 : 使 用 fetch http://gopl.io/chl/helloworld?go-get=1， 找到 本 书 的 示例 代码 
是 由 那个 服务 托管 的 ( go get 发 出 的 HTTP 请 求 包含 go-get 参数 ， 这 样 服务 器 可 以 区 分 出 普 
通 的 浏览 器 请 求 。) 


10.7.3” 包 的 构建 


go build 命令 编译 每 一 个 命令 行 参数 中 的 包 。 如 果 包 是 一 个 库 ， 结 果 会 被 舍弃 ; 对 于 没 
有 编译 错误 的 包 几 乎 不 做 检查 。 如 果 包 的 名 字 是 main，go build 调用 链接 器 在 当前 目录 中 创 
建 可 执行 程序 ， 可 执行 程序 的 名 字 取 自 包 的 导入 路 径 的 最 后 一 段 。 

每 一 个 目录 包含 一 个 包 ， 每 一 个 可 执行 程序 或 者 UNIX 命令 都 需要 自己 的 目录 。 这 些 目 
录 可 能 是 cmd 目录 的 子 目录 ， 比 如 golang.org/x/tools/cmd/godoc 命令 ， 为 Go 包 的 文档 提供 
Web 访问 接口 (参考 10.7.4 节 )。 

如 前 所 述 ， 包 可 以 指定 通过 目录 来 指定 ， 可 以 使 用 导入 路 径 或 者 一 个 相对 目录 名 ， 目 
录 必 须 以 . 或 .. 开头 ， 即 使 这 不 经 常 需要 。 如 果 没 有 提供 参数 ， 会 使 用 当前 目录 作为 参数 。 
所 以 ， 以 下 命令 : 

$ cd $GOPATH/src/gopl.io/ch1/helloworld 

$ go build 
和 以 下 命令 : 


$ cd anywhere 
$ go build gopl.io/ch1/helloworld 


以 及 以 下 命令 : 

$ cd $GOPATH 

$ go build ./src/gopl.io/ch1/helloworld 

构建 同样 的 包 (尽管 每 次 写 人 的 目录 是 go build 命令 运行 时 所 在 的 目录 )。 但 以 下 命令 
编译 不 同 的 包 : 

$ cd $GOPATH 

$ go build src/gopl.io/ch1/hellowor1l1d 

Error: cannot find package "src/gopl.io/ch1i/helloworld". 

包 也 可 以 使 用 一 个 文件 列表 来 指定 (尽管 这 只 是 针对 小 型 的 程序 和 一 次 性 的 实验 )。 如 
果 包 名 是 main， 可 执行 程序 的 名 字 来 自 第 一 个 .go 文件 名 的 主体 部 分 。 


$ cat quoteargs.go 
package main 
import ( 

"fmt" 

"oo" 
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func main() { 
fmt.Printf("%q\n", os.Args[1:]) 


} 

$ go build quoteargs.go 

$ ./quoteargs one "two three" four\ five 
["one" "two three" "four five"] 


特别 是 对 于 这 类 即 用 即 抛 型 的 程序 ， 我 们 需要 在 构建 之 后 尽快 运行 。go run 命令 将 这 两 
步 合 并 起 来 : 


$ go run quoteargs.go one "two three" four\ five 
["one" "two three" "four five"] 


第 一 个 不 是 以 .go 文件 结尾 的 参数 会 作为 Go 可 执行 程序 的 参数 列表 的 开始 。 
默认 情况 下 ，go build 命令 构建 所 有 需要 的 包 以 及 它们 所 有 的 依赖 性 ， 然 后 丢弃 除了 最 
终 可 执行 程序 之 外 的 所 有 编译 后 的 代码 。 依 赖 性 分 析 和 编译 本 身 都 非常 快 ， 但 是 当 项 目 增长 
到 数 十 个 包 和 数 十 万 行 代码 的 时 候 ， 重 新 编译 依赖 性 的 时 间 明 显 变 慢 ， 也 许 数秒 钟 的 时 间 ， 
即使 依赖 的 部 分 根本 没有 改变 过 。 
go install 命令 和 go build 非常 相似 ， 区 别 是 它 会 保存 每 一 个 包 的 编译 代码 和 命令 ， 而 
不 是 把 它们 丢弃 。 编 译 后 的 包 保 存在 $6oPATH/pkg 目录 中 ， 它 对 应 于 存放 源 文件 的 src 目录 ， 
可 执行 的 命令 保存 在 $6oPATH/bin 目录 中 。( 许 多 用 户 将 $6oPATH/bin 加 入 他 们 的 可 执行 搜索 
路 径 中 s) 这 样 ，go build 和 go install 对 于 没有 改变 的 包 和 命令 不 需要 重新 编译 ， 从 而 使 后 
续 的 构建 更 加 快速 。 惯 例 上 ，go build -i 可 以 将 包 安 装 在 独立 于 构建 目标 的 地 方 。 
_ 因为 编译 包 根据 操作 系统 平台 和 CPU 体系 结构 不 同 而 不 同 ， 所 以 go install 将 保存 它 
们 的 目录 命名 为 与 600s 和 GoARCH 变量 的 值 相关 。 例 如 ， 在 Mac 上 面 golang.org/x/net/html 
编译 后 的 文件 golang.org/x/net/html.a 放 在 $60PATH/pkg/darwin_amd64 目录 下 面 。 
8Eop].io/chTI6/cross 
func main() { 


fmt.Println(runtime.GOOS, runtime.GOARCH) 
} 


下 面 的 命令 分 别 生成 64 位 和 32 位 的 可 执行 程序 : 


$ go build gop1l.io/ch16/cross 

$ ./cross 

darwin amd64 

$ GOARCH=386 go build gop1l.io/ch16/cross 
$ ./cross 

darwin 386 


例如 ， 为 了 处 理 底层 的 可 移植 性 问题 或 为 重要 的 例 程 提供 优化 版 本 ， 有 一 些 包 需 要 为 特定 
的 平台 或 者 处 理 器 编译 不 同 版 本 的 代码 。 如 果 一 个 文件 名 包含 操作 系统 或 处 理 器 体系 结构 名 字 
(如 net_linux.go 或 asm_amd64.s)，go 工具 只 会 在 构建 指定 规格 的 目标 文件 的 时 候 才 进行 编译 。 
叫 作 构 建 标签 的 特殊 注释 ， 提 供 更 细 粒 度 的 控制 。 例 如 ， 如 果 一 个 文件 包含 下 面 的 注释 : 


// +build linux darwin 


注释 在 包 的 声明 之 前 ( 它 是 文档 注释 )，go build 只 会 在 构建 Linux 或 Mac OS X 系统 应 
用 的 时 候 才 会 对 它 进行 编译 ， 下 面 的 注释 指出 任何 时 候 都 不 要 编译 这 个 文件 : 


// +build ignore 
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更 多 的 细节 可 以 在 go/build 包 的 文档 中 的 Build Constraints 节 找 到 : 


$ go doc go/build 


10.7.4 包 的 文档 化 


Go 风格 强烈 鼓励 有 良好 的 包 API 文档 。 每 一 个 导出 的 包 成 员 的 声明 以 及 包 声 明 自 身 应 
该 立刻 使 用 注释 来 描述 它 的 目的 和 用 途 。 

Go 文档 注释 总 是 完整 的 语句 ， 使 用 声明 的 包 名 作为 开头 的 第 一 名 注释 通常 是 总 结 。 画 
数 参 数 和 其 他 的 标识 符 无 须 括 起 来 或 者 特别 标注 。 例 如 ，fmt.Fprintf 的 文档 注释 如 下 : 

// Fprintf 根据 格式 说 明 符 格式 化 并 写 入 w 

// 返回 写 入 的 字 节 数 及 可 能 遇 到 的 错误 

func Fprintf(w io.Writer, format string, a ...interface{}) (int, error) 

Fprintf 的 格式 化 细节 在 fmt 包 自 身 的 文档 注释 中 进行 解释 。 包 声明 的 前 面 的 文档 注释 
被 认为 是 整个 包 的 文档 注释 。 尽 管 它 可 以 出 现在 任何 文件 中 ,但 是 必须 只 有 一 个 。 比 较 长 的 
包 注 释 可 以 使 用 一 个 单独 的 注释 文件 ，fmt 的 注释 超过 300 行 ， 文 件 名 通常 I doc .go。 

好 的 文档 不 一 定 是 洋洋 洒洒 的， 而 简明 是 文档 一 个 不 可 替代 的 优点 。 事 实 上 ，Go 在 文 
档 保持 简练 和 简单 方面 的 惯例 和 其 他 所 有 的 东西 一 样 ， 因 为 文档 像 代 码 一 样 也 需要 维护 。 许 
多 声明 可 以 在 一 个 通顺 的 句子 中 解释 清楚 ， 并 且 如 果 这 个 行为 非常 明确 ， 就 不 需要 注释 。 

在 全 书 中 篇 幅 允 许 时 ， 就 会 使 用 doc 注释 来 进行 前 置 声明 ， 但 是 在 你 浏览 标准 库 时 你 会 
发 现 更 好 的 示例 。 如 果 你 想 这 样 做 ， 有 两 个 工具 可 以 给 你 提供 更 多 方便 。 

go doc 工具 输出 在 命令 行 上 指定 的 内 容 的 声明 和 整个 文档 注释 ， 这 也 许 是 一 个 包 : 


$ go doc time 
package time // 导入 "time" 


Package time provides functionality for measuring and displaying time. 


const Nanosecond Duration = 1 ... 
func After(d Duration) <-chan Time 
func Sleep(d Duration) 

func Since(t Time) Duration 

func Now() Time 

type Duration int64 

type Time struct { ... } 

A 


或 者 是 一 个 包 成 员 : 


$ go doc time.Since 
func Since(t Time) Duration 


Since returns the time elapsed since t. 
It is shorthand for time.Now().Sub(t). 


或 者 是 一 个 方法 : 


$ go doc time.Duration.Seconds 
func (d Duration) Seconds() float64 


Seconds returns the duration as a floating-point number of seconds . 
该 工具 不 需要 完整 的 导入 路 径 或 者 正确 的 标识 符 。 这 个 命令 输出 来 自 encoding/json 包 
的 (*json.Decoder).Decode 的 文档 : 
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$ go doc json.decode 
func (dec *Decoder) Decode(v interface{}) error 


Decode reads the next JSON-encoded value from its input and stores 
it in the value pointed to by v. 


有 点 迷惑 的 是 ， 第 二 个 工具 名 字 叫 godoc， 它 提供 相互 链接 的 HTML 页 面 服务 ， 进 而 
提供 不 少 于 go doc 命令 的 信息 。 在 https://golang.org/pkg 的 godoc 服务 器 覆盖 了 标准 库 。 
图 10-1 展示 了 time 包 的 文档 ， 在 11.6 节 中 ， 我 们 将 看 到 godoc 中 交互 式 显 示 的 程序 示例 。 
在 https://godoc.org 的 godoc 服务 器 提供 数 千 个 可 搜索 的 开源 包 索 引 。 


网 wm- -Go Frogremmino x 
Da Lo ; golang. org/pkgfime/ 至 
让 


Te Go Progrmming largeos 画面 加 一 一 


Package time 
import "time" 


Overview 
Index 
Examples 


Overview v 


Package time provides functionality for measuring and displaying time. 


The calendrical calculations always assume a Gregorian calendar. 
Index v 


Constants 

func After(d Duration) <-chan Time 

func Sleep(d Duration) 

func Tick(d Duration) <-chan Time 

type Duration 

func ParseDuration(s string) (Duration, error) 
func Since(t Time) Duration 
func (d Duration) Hours() float64 
func (d Duration) ID float64 





图 10-1 godoc 中 的 time 包 


如 果 你 想 浏览 你 自己 的 包 ， 你 也 可 以 在 你 的 工作 空间 中 运行 一 个 godoc 实例 。 在 执行 下 
面 的 命令 后 ， 在 浏览 器 中 访问 http://localhost:8898/pkg: 


$ godoc -http :8666 


加 上 -analysis=type 和 -analysis=pointer 标记 使 文档 内 容 丰 富 ， 同 时 提供 源 代 码 的 高 级 


10.7.5 内 部 包 


这 是 包 用 来 封装 Go 程序 最 重要 的 机 制 。 没 有 导出 的 标识 符 只 能 在 同一 个 包 内 访问 ， 导 

出 的 标识 符 可 以 在 世界 任何 地 方 访问 。 
有 时 ， 有 一 个 中 间 地 带 是 很 有 帮助 的 ， 这 种 方式 定义 标识 符 可 以 被 一 个 小 的 可 信任 的 包 
合 访问 ， 但 不 是 所 有 人 可 以 访问 。 例 如 ， 当 我 们 将 一 个 大 包 分 解 为 多 个 可 托管 的 小 包 时 ， 
我 们 不 想 对 其 他 的 包 显 露 这 些 包 之 间 的 关系 。 或 者 我 们 想 在 不 进行 导出 的 情况 下 ， a 
一 些 包 中 间 共 享 一 些 工具 函数 。 或 者 我 们 只 是 想 试验 一 个 新 的 包 ， 而 不 是 永久 地 提交 给 它 的 
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API， 可 以 通过 加 上 一 个 允许 访问 的 有 限 客户 列表 来 实现 。 

为 了 解决 这 些 需求 , go build 工具 会 特殊 对 待 导 人 路 径 中 包含 路 径 片 段 internal 的 情况 。 
这 些 包 叫 内 部 包 。 内 部 包 只 能 被 另 一 个 包 导 入 ， 这 个 包 位 于 以 internal 目录 的 父 目 录 为 根 
目录 的 树 中 。 例 如 ， 给 定 下 面 的 包 ，net/http/internal/chunked 可 以 从 net/http/httputil 或 
net/http 导 人 和 人， 但 是 不 能 从 net/url 进行 导入 。 然 而 ，net/url 可 以 导入 net/http/httputil。 


net/http 
net/http/internal/chunked 
net/http/httputil 

net/url 


10.7.6 包 的 查询 


go list 工具 上 报 可 用 包 的 信息 。 通 过 最 简单 的 形式 ，go list 判断 一 个 包 是 否 存在 于 工 
作 空间 中 ， 如 果 存 在 输出 它 的 导入 路 径 ; 


$ go list github.com/go-sql-driver/mysql 
github.com/go-sql-driver/mysql 


go list 命令 的 参数 可 以 包含 “ .…” 通 配 符 ， 它 用 来 匹配 包 的 导入 路 径 中 的 任意 子 串 。 
可 以 使 用 它 枚 举 一 个 Go 工作 空间 中 的 所 有 包 : 


$0 List es 
archive/tar 
archive/zip 

bufio 

bytes 
cmd/addr2line 
cmd/api 

.., 更 多 其 他 的 包 ... 


或 者 一 个 指定 的 子 树 中 的 所 有 包 : 


$ go list gopl.io/ch3/... 
gopl.io/ch3/basenamel1 
gopl.io/ch3/basename2 
gopl.io/ch3/comma 
gopl.io/ch3/mandelbrot 
gopl.io/ch3/netflag 
gopl.io/ch3/printints 
gopl.io/ch3/surface 


或 者 一 个 具体 的 主题 : 


$0 Jit aXMl .ss 
encoding/xml 
gopl.io/ch7/xmlselect 


go list 命令 获取 每 一 个 包 的 完整 元 数据 ， 而 不 仅仅 是 导入 路 径 ， 并 且 提 供 各 种 对 于 用 
户 或 者 其 他 工具 可 访问 的 格式 。-json 标记 使 go list 以 JSON 格式 输出 每 一 个 包 的 完整 记录 : 


$ go list -json hash 
{ 
"Dir": "/home/gopher/go/src/hash", 
"ImportPpath": "hash", 
"Name": "hash", 本 
"Doc": "Package hash provides interfaces for hash functions.", 
"Target": "/home/gopher/go/pkg/darwin_amd64/hash.a", 
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"Goroot": .true, 
"Standard": true, 
"Root": "/home/gopher/go", 


"GoFiles": [ 
"hash.go" 

]， 

"Imports": [ 
"io" 

]， 

"Deps": [ 
"errors", 
2 
"runtime", 
"Sync™; 
"sync/atomic", 
"unsafe" 

] 


} 


-f 标记 可 以 让 用 户 通 过 text/template 包 提 供 的 模板 语言 来 定制 输出 格式 (参考 4.6 节 )。 
这 个 命令 输出 strconv 包 的 依赖 过 渡 关 系 记录 ， 记 录 之 间 由 空格 分 割 : 

$ go list -f '{{join .Deps " "}}' strconv 

errors math runtime unicode/utf8 unsafe 


这 条 命令 输出 标准 库 的 compress 子 树 中 每 个 包 的 直接 导入 记录 : 


$ go list -f '{{.ImportPpath}} -> {{join .Imports " "}}' compress/... 
compress/bzip2 -> bufio io sort 
compress/flate -> bufio fmt io math sort strconv 


compress/gzip -> bufio compress/flate errors fmt hash hash/crc32 io time 
compress/lzw -> bufio errors fmt io 


compress/zlib -> bufio compress/flate errors fmt hash hash/adler32 io 


go list 对 于 一 次 性 的 交互 查询 和 构建 、 测 试 脚本 都 非常 有 用 。 我 们 将 在 11.2.4 节 再 次 
使 用 它 。 更 多 的 参数 以 及 它们 的 含义 等 信息 ， 可 以 通过 执行 go help list 来 获取 。 

本 章 讨论 了 go 工具 中 几乎 所 有 重要 的 子 命令 (除了 一 个 子 命令 外 )。 下 一 章 讲述 如 何 使 
用 go test 命令 测试 Go 程序 。 

练习 10.4 : 构建 一 个 工具 ， 它 可 以 汇报 工作 空间 中 所 有 包 的 过 度 依赖 中 ， 是 否 含有 参 
数 中 指定 的 包 。 提 示 : 你 将 需要 执行 两 次 go list， 一 次 是 针对 初始 包 ， 一 次 是 针对 所 有 包 。 
你 也 许 想 使 用 encoding/json 包 (参考 4.5 节 ) 来 解析 它 的 JSON 格式 输出 内 容 。 
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英里 斯 威 尔 克 斯 ( Maurice Wilkes) 设计 和 制造 了 世界 上 第 一 台 存 储 程序 式 计 算 机 
EDSAC， 在 1949 年 有 一 次 实验 室 爬 楼 梯 的 时 候 ， 针 对 测试 讲述 了 一 番 颇 有 洞察 力 的 话 。 在 
《一 个 计算 机 先驱 的 回忆 》( Memoirs of A Computer Pioneer) 一 书 中 ， 他 回忆 道 :“ 我 强烈 地 
意识 到 我 余生 的 很 大 一 部 分 时 间 都 将 用 来 寻找 我 程序 中 的 错误 。” 当然 ， 从 那 时 开始 ， 虽 然 
或 许 也 会 对 他 对 软件 构建 复杂 度 认识 的 不 足 感到 困惑 ， 但 是 每 一 个 存储 程序 式 计算 机 程序 员 
都 会 赞同 他 这 番 话 。 

今天 的 软件 项 目 比 威 尔 克 斯 年 代 的 要 庞大 、 复 杂 得 多 ， 并 且 在 使 软件 复杂 度 可 以 控制 的 
技术 上 面 ， 人 们 投入 了 大 量 的 精力 。 其 中 有 两 种 技术 尤其 有 效 ， 第 一 是 软件 发 布 之 前 的 例 行 
同行 评审 ， 另 一 个 就 是 本 章 的 主题 : 测试 。 

测试 是 自动 化 测试 的 简称 ， 即 编写 简单 的 程序 来 确保 程序 (产品 代码 ) 在 该 测试 中 针对 
特定 输入 产生 预期 的 输出 。 这 些 测试 通常 要 么 是 经 过 精心 设计 之 后 用 来 检测 某 种 功能 ， 要 么 
是 随机 性 的 ， 用 来 扩大 测试 的 覆盖 面 。 

软件 测试 领域 内 容 很 广泛 。 测 试 任务 几乎 占据 了 所 有 程序 员 的 一 部 分 时 间 ， 有 时 候 甚至 
是 一 些 程序 员 所 有 的 时 间 。 关 于 测试 的 资料 有 数 千 本 书 和 数 百 万 字 的 博文 。 在 每 一 门 主流 的 
程序 设计 语言 中 ， 都 有 很 多 软件 包 专门 用 来 构建 测试 ， 其 中 有 一 些 还 包含 很 多 理论 ， 并 且 这 
个 领域 吸引 了 很 多 拥有 众多 拥 熏 的 先知 。 这 些 足 够 使 得 程序 员 相 信 为 了 写 好 测试 ， 他 们 必须 
掌握 一 种 新 的 技能 。 

Go 的 测试 方法 看 上 去 相对 比较 低级 。 它 依赖 于 命令 go test 和 一 些 能 用 go test 运行 的 
测试 函数 的 编写 约定 。 这 个 相对 轻 量 级 的 机 制 对 单纯 的 测试 很 有 效 ， 并 且 这 种 方式 也 很 自然 
地 扩展 到 基准 测试 和 文档 系统 的 示例 。 

实际 上 ， 编 写 测 试 代 码 和 编写 原始 程序 并 没有 什么 不 同 。 我 们 编写 聚焦 于 任务 的 部 分 功 
能 的 简单 函数 。 我 们 必须 谨防 条 件 边界 ， 思 考 数据 结构 ， 并 且 合 理 地 设计 如 何 根 据 合适 的 输 
入 得 到 输出 。 这 和 编写 常规 的 Go 代码 没有 区 别 ， 这 不 需要 新 的 注解 、 约 定 和 工具 。 


11.1 go test 工具 

go _ test 子 命令 是 Go 语言 包 的 测试 驱动 程序 ， 这 些 包 根据 某 些 约定 组 织 在 一 起 。 在 一 个 
包 目 录 中 ， 以 _test.go 结尾 的 文件 不 是 go build 命令 编译 的 目标 ， 而 是 go test 编译 的 目标 。 

在 *_test.go 文件 中 ， 三 种 函数 需要 特殊 对 待 ， 即 功能 测试 函数 、 基 准 测试 函数 和 示例 
函数 。 功 能 测试 函数 是 以 Test 前 级 命名 的 函数 ， 用 来 检测 一 些 程序 逻辑 的 正确 性 ，go test 
运行 测试 函数 ， 并 且 报 告 结果 是 PASs 还 是 FAIL。 基 准 测试 函数 的 名 称 以 Benchmark 开头 ， 用 
来 测试 某 些 操 作 的 性 能 ，go test 汇报 操作 的 平均 执行 时 间 。 示 例 函 数 的 名 称 ， 以 Example 
开头 ， 用 来 提供 机 器 检查 过 的 文档 。11.2 节 讲 解 功 能 测试 函数 ，11.4 节 讲 解 基准 测试 函数 ， 
11.6 节 讲 解 示例 函数 。 

go test 工具 扫描 *_test.go 文件 来 寻找 特殊 函数 ， 并 生成 一 个 临时 的 main 包 来 调用 它 
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们 ， 然 后 编译 和 和 运行， 并 汇报 结果 ， 最 后 清空 临时 文件 。 


11.2 Test 函数 
每 一 个 测试 文件 必须 导入 testing 包 。 这 些 函 数 的 函数 签名 如 下 


func TestName(t *testing.T) { 


VN 
} 
功能 测试 函数 必须 以 Test 开头 ， 可 选 的 后 缀 名 称 必须 以 大 写字 母 开 头 : 
func TestSin(t *testing.T) { /* ... */ } 
func TestCos(t *testing.T) { /* ... */ } 
func TestLog(t *testing.T) { /* ... */ } 


参数 t 提供 了 汇报 测试 失败 和 日 志 记 录 的 功能 。 定 义 一 个 示例 包 gop1.io/ch11/word1， 
个 包 包 含 一 个 函数 IsPalindrome ， 用 来 判断 一 个 字符 串 是 否 是 回 文字 符 串 (这 个 函数 在 字 
符 串 是 回 文字 符 串 的 情况 下 对 于 每 个 字 节 检查 了 两 次 ， 后 面 会 实现 简短 的 版 本 )。 


gopl1.io/ch11/word1 
// 包 word 提供 了 文字 游戏 相关 的 工具 函数 


package word 


// IsPalindrome 判断 一 个 字符 串 是 否 是 回 文字 符 串 
// (Our first attempt.) 
func IsPalindrome(s string) bool { 
for i := range st{ 
if s[i] != s[len(s)-1-i] { 
return false 





} 
} 


return true 


} 


在 同一 个 目录 中 ， 文 件 word_test.go 包 含 了 两 个 功能 测试 函数 Testpalindrome 和 
TestNonPalindrome。 了 两 个 困 数 都 检查 isPalindrome 是 否 针 对 单个 输入 参数 给 出 了 正确 的 结果 ， 
并 且 用 tt.Error 来 报错 。 


package word 
import "testing" 


func TestPalindrome(t *testing.T) { 
if !IsPalindrome("detartrated") { 
t.Error(` IsPalindrome("detartrated") = false`) 


De 
if !IsPalindrome("kayak") { 
t.Error( IsPalindrome("kayak") = false`) 
} 
下 


func TestNonPalindrome(t *testing.T) { 
if IsPalindrome("palindrome") { 
t.Error( IsPalindrome("palindrome") = true `) 
} 
} 


go test (或 者 go build) 命令 在 不 指定 包 参 数 的 情况 下 ， 以 当前 目录 所 在 的 包 为 参数 。 
可 以 用 下 面 的 命令 来 编译 和 运行 测试 : 
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$ cd $GOPATH/src/gopl.io/ch11/word1 
$ go test 
ok gopl.io/ch1i1l/word1 0.888s 


测试 通过 ， 我 们 发 布 了 程序 ， 但 是 午餐 聚会 的 客人 们 离开 不 久之 后 ， 就 开始 有 bug 提交 
过 来 了 。 有 个 法 国 用 户 Noelle Eve Elleon 抱怨 说 IsPalindrome 晴 数 无 法 识别 “été”。 男 一 个 
来 自 中 美洲 的 用 户 对 程序 无 法 判断 出 “A man，a plan，a canal: Panama” 也 是 回 文 感到 失望 。 
这 些 特定 的 小 bug 自然 导致 了 新 的 测试 用 例 的 产生 。 

func TestFrenchPalindrome(t *testing.T) { 


if !IsPalindrome("ete") { 
t.Error( IsPalindrome( "ete") = false ) 


5 
} 
func TestCanalPalindrome(t *testing.T) { 
input := "A man, a plan, a canal: Panama” 
if !IsPalindrome(input) { 
t.Errorf(`IsPalindrome(%q) = false , input) 
} 
} 


由 于 input 很 长 ， 为 了 避免 写 两 次 ， 这 里 使 用 了 函数 Errorf， 这 个 函数 和 Printf 一 样 提 
供 了 格式 化 功能 。 
当 添 加 这 两 个 新 的 测试 之 后 ，go test 命令 失败 了 ， 给 出 如 下 错误 消息 : 
$ go test 
--- FAIL: TestFrenchPalindrome (6.66s) 
word_test.go:28: IsPalindrome("ete") = false 
--- FAIL: TestCanalPalindrome (6.66s) 
word _ test.go:35: IsPalindrome("A man, a plan, a canal: Panama") = false 
- FAIL 
FAIL gopl.io/ch11/word1 6.614s 
比较 好 的 实践 是 先 写 测试 然后 发 现 它 触发 的 错误 和 用 户 bug 报告 里 面 的 一 致 。 只 有 这 个 
时 候 ， 我 们 才能 确信 我 们 修复 的 内 容 是 针对 这 个 出 现 的 问题 的 。 
男 外 ， 运 行 go test 比 手动 测试 bug 报告 中 的 内 容 要 快 得 多 ， 测 试 可 以 让 我 们 顺序 地 检 
查 内 容 。 如 果 一 个 测试 套件 (test suite) 里 面 有 很 多 测试 用 例 ， 我 们 可 以 选择 性 地 测试 用 例 


来 加 加 测试 过 程 。 
选项 -v 可 以 输出 包 中 每 个 测试 用 例 的 名 称 和 执行 的 时 间 : 
$ go test -v 


=== RUN TestPalindrome 
--- PASS: Testpalindrome (6.66s) 
=== RUN TestNonPalindrome 
--- PASS: TestNonPalindrome (6.66s) 
=== RUN TestFrenchPalindrome 
--- FAIL: TestFrenchPalindrome (6.66s) 
word_test.go:28: IsPalindrome("ete") = false 
=== RUN TestCanalPalindrome 
~-- FAIL: TestCanalPalindrome (8.66s) 
word_test.go:35: IsPalindrome("A man, a plan, a canal: Panama") = false 


exit status 1 
FAIL gopl.io/ch1il/word1 68.617s 
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选项 -run 的 参数 是 一 个 正则 表达 式 ， 它 可 以 使 得 go test 只 运行 
给 定 模式 的 函数 : 


$ go test -v -run="French|Canal" 
=== RUN TestFrenchPalindrome 
--- FAIL: TestFrenchpalindrome (8.66s) 
word_test.go:28: IsPalindrome("été") = false 
=== RUN TestCanalPalindrome 
-- FAIL: TestCanalPalindrome (6.66s) 
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那些 测试 函数 名 称 匹配 


word_test.go:35: IsPalindrome("A man, a plan, a canal: Panama") = false 


FAIL 
exit status 1 
FAIL gopl.io/ch1i1/word1 8.614s 


当然 一旦 我 们 使 得 选择 的 测试 用 例 通 过 之 后 ， 在 我 们 提交 更 改 之 前 ， 我 们 必须 重新 使 


用 不 带 开关 的 go test 来 运行 一 次 整个 测试 套件 。 


现在 的 任务 是 修复 bug。 我 们 经 过 迅速 地 调查 发 现 第 一 个 bug 的 原因 是 函数 
IsPalindrome 使 用 字 节 序列 而 不 是 字符 序列 来 比较 ， 因 此 那些 非 ASCII 字符 (例如 "ete" 中 
的 “é”) 就 使 得 程序 困惑 了 。 第 二 个 bug 的 原因 是 没有 忽略 空格 、 标 点 符号 和 字母 大 小 写 。 


有 了 教训 后 ， 我 们 仔细 地 重 写 了 这 个 函数 : 


gopl.io/ch11/word2 
// 包 word 提供 了 文字 游戏 相关 的 工具 函数 


package word 
import "unicode" 


// IsPalindrome 判断 一 个 字符 串 是 否 是 回 文字 符 串 
// 忽略 字母 大 小 写 ， 以 及 非 字母 字符 
func IsPalindrome(s string) bool { 
var letters []rune 
for _,r := range st{ 
if unicode.IsLetter(r) { 
letters = append(letters, unicode.ToLower(r)) 


此 
} 
for i := range letters { 
if letters[i] != letters[len(letters)-1-i] { 
return false 
. 
} 


return true 


} 


我 们 还 写 了 更 加 全 面 的 测试 用 例 ， 把 前 面 的 用 例 和 新 的 用 例 结合 


func TestIspalindrome(t *testing.T) { 

var tests = []struct { 
input string 
want bool 

}{ 
{"", true}, 
{a “trues 
{"aa", true}, 
{"ab", false}, 
{"kayak", true}, 
{"detartrated", true}, 
{"A man, a plan, a canal: Panama", true}, 
{"Evil I did dwell; lewd did I live.", true}, 


到 一 个 表 里 面 。 
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{"Able was I ere I saw Elba", true}, 
{"été", true}, 

{"Et se resservir, ivresse reste.", true}, 
{"palindrome"，false}，// 非 回 文 
{"desserts", false}， // 半 回 文 


for _, test := range tests { 
if got := IsPalindrome(test.input); got != test.want { 
t.Errorf("IsPpalindrome(%q) = %v", test.input, got) 
} 
} 
} 


新 的 测试 可 以 通过 了 : 


$ go test gopl.io/ch11/word2 
ok gopl.io/ch11/word2 8.615s 


这 种 基于 表 的 测试 方式 在 Go 里 面 很 常见 。 根 据 需 要 添加 新 的 表 项 目 很 直观 ， 并 且 由 于 
断言 逻辑 没有 重复 ， 因 此 我 们 可 以 花 点 精力 让 输出 的 错误 消息 更 好 看 一 点 。 

当前 调用 t.Errorf 输出 的 失败 的 测试 用 例 信息 没有 包含 整个 跟踪 栈 信息 ， 也 不 会 导致 
程序 宕 机 或 者 终止 执行 ， 这 和 很 多 其 他 语言 的 测试 框架 中 的 断言 不 同 。 测 试用 例 彼此 是 独立 
的 。 如 果 测 试 表 中 的 一 个 条 目 造 成 测试 失败 ， 那 么 其 他 的 条 目 仍 然 会 继续 测试 ， 这 样 我 们 就 
可 以 在 一 次 测试 过 程 中 发 现 多 个 失败 的 情况 。 

如 果 我 们 真 的 需要 终止 一 个 测试 函数 ， 比 如 由 于 初始 化 代码 失败 或 者 避免 已 有 的 错误 产 
生 令 人 困惑 的 输出 ， 我 们 可 以 使 用 t.Fatal 或 者 t.Fatalf 函数 来 终止 测试 。 这 些 函 数 的 调用 
必须 和 Test 函数 在 同一 个 goroutine 中 ， 而 不 是 在 测试 创建 的 其 他 goroutine 中 。 

测试 错误 消息 一 般 格式 是 "f(x)=y, wantz"， 这 里 f(x) 表示 需要 执行 的 操作 和 它 的 输 
入 , y 是 实际 的 输出 结果 ，z 是 期 望 得 到 的 结果 。 出 于 方便 ， 对 于 f(x) 我 们 会 使 用 Go 的 
语法 ， 比 如 在 上 面 回 文 的 例子 中 ,我们 使 用 Go 的 格式 化 来 显示 较 长 的 输入 ， 避 人 免 重复 输 
入 。 在 基于 表 的 测试 中 ,输出 x 是 很 重要 的 ， 因 为 一 条 断言 语句 会 在 不 同 的 输入 情况 下 执 
行 多 次 。 错 误 消 息 要 避免 样板 文字 和 宛 余 信息 。 在 测试 一 个 布尔 函数 的 时 候 ， 比 如 上 面 的 
IspPalindrome， 省 略 "wantz" 部 分 ， 因 为 它 没有 给 出 有 用 信息 。 如 果 x、y、z 都 比较 长 ， 可 以 
输出 准确 代表 各 部 分 的 概要 信息 。 在 程序 员 诊断 一 个 测试 失败 的 时 候 ， 测 试用 例 的 作者 必须 
努力 帮助 程序 员 。 

练习 11.1: 为 4.3 节 的 charcount 程序 编写 测试 用 例 。 

练习 11.2: 为 6.5 节 的 Intset 编写 测试 用 例 用 来 检测 它 的 行为 在 每 一 次 操作 之 后 和 基 
于 内 置 的 map 实现 的 set 一 致 。 保 存 你 的 实现 ， 我 们 将 在 练习 11.7 中 会 进行 基准 测试 。 


11.2.1 随机 测试 

基于 表 的 测试 方便 针对 精心 选择 的 输入 检测 函数 是 否 工作 正常 ， 以 测试 逻辑 上 引 人 关 注 
的 用 例 。 另 外 一 种 方式 是 随机 测试 ， 通 过 构建 随机 输入 来 扩展 测试 的 覆盖 范围 。 

如 果 给 出 的 输入 是 随机 的 ， 我 们 怎么 知道 函数 输出 什么 内 容 呢 ? 这 里 有 两 种 策略 。 一 种 
方式 就 是 额外 写 一 个 函数 ， 这 个 函数 使 用 低 效 但 是 清晰 的 算法 ， 然 后 检查 这 两 种 实现 的 输出 
是 否 一 致 。 另 外 一 种 方式 是 构建 符合 某 种 模式 的 输入 ， 这 样 我 们 可 以 知道 它们 对 应 的 输出 是 
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什么 。 
下 面 的 例子 使 用 了 第 二 种 方式 ，randompalindrome 函数 产生 一 系列 的 回 文字 符 串 ， 这 些 
输出 在 构建 的 时 候 就 确定 是 回 文字 符 串 了 。 


import "math/rand" 


// randomPalindrome 返回 一 个 回 文字 符 串 ， 它 的 长 度 和 内 容 都 是 随机 数 生 成 器 /rng 生 成 的 
func randompalindrome(rng *rand.Rand) string { 
n := rng.Intn(25) // 随机 字符 串 最 大 长 度 是 24 
runes := make([Jrune, n) 
for i := @; i < (n+1)/2; i++ { 
rn := rune(rng.Intn(6x1686)) // 随机 字符 最 大 是 '\u8999' 
runes[i] =r 
runes[n-1-i] = r 


return string(runes) 


} 


func TestRandompalindromes(t *testing.T) { 
// 初始 化 一 个 伪 随 机 数 生成 器 
seed := time.Now().UTC().UnixNano() 
t.Logf("Random seed: %d", seed) 


rng := rand.New(rand.NewSource(seed)) 
for i := 0@; i < 1666; i+t+ { 
p := randomPalindrome(rng) 


if !IsPalindrome(p) { 
t.Errorf("IsPalindrome(%q) = false", p) 
} 

} 

由 于 随机 测试 的 不 确定 性 ， 在 遇 到 测试 用 例 失 败 的 情况 下 ， 一 定 要 记录 足够 的 信息 以 
便于 重 现 这 个 问题 。 在 该 例子 中 ， 函 数 Ispalindrome 的 输入 p 告诉 我 们 所 需要 知道 的 所 有 信 
息 ， 但 是 对 于 那些 拥有 更 复杂 输入 的 函数 来 说 ， 记 录 伪 随机 数 生成 器 的 种 子 (如 我 们 所 做 的 
那样 ) 会 比 转 储 整个 输入 数据 结构 要 简单 得 多 。 有 了 随机 数 的 种 子 ， 我 们 可 以 简单 地 修改 测 
试 代码 来 准确 地 重 现 错误 。 

通过 使 用 当前 时 间作 为 伪 随 机 数 的 种 子 源 ， 在 测试 的 整个 生命 周期 中 ， 每 次 运行 的 时 候 

会 得 到 新 的 输入 。 如 果 你 的 项 目 使 用 自动 化 系统 来 间 周期 地 运行 测试 ， 这 一 点 很 重要 。 
练习 11.3: TestRandompalindromes 函数 仅 测试 回 文字 符 串 。 编 写 一 个 随机 测试 用 来 产生 
并 检测 非 回 文字 符 串 。 
练习 11.4: 修改 randompalindrome 来 测试 TsPalindrome 困 数 对 标点 符号 和 空格 的 处 理 。 


11.2.2 ”测试 命令 


go test 工具 对 测试 库 代码 包 很 用， 但 是 也 可 以 将 它 用 于 测试 命令 。 包 名 main 一 般 会 
产生 可 执行 文件 ， 但 是 也 可 以 当做 库 来 导入 。 

为 2.3.2 节 的 echo 程序 写 一 个 测试 。 把 程序 分 为 两 个 函数 ，echo 执行 逻辑 ， 而 main 用 来 
读 取 和 解析 命令 行 参数 以 及 报告 echo 函数 可 能 返回 的 错误 。 


gopl.io/ch11/echo 


实现 来 记录 写 人 的 内 容 以 便于 后 面 检查 。 下 面 是 测试 代码 (在 文件 echo_test.go 中 ): 


// Echo 输出 它 的 命令 行 参数 
package main 


import ( 
"flag" 
"fmt" 
"io" 
"os" 
"strings" 
) 
var ( 
n = flag.Bool("n", false, "omit trailing newline") 


flag.String("s", " ", "separator") 


- Mn 
| 


var out io.Writer = os.Stdout // 测试 过 程 中 被 更 改 


func main() { 
flag.Parse() 


if err := echo(!*n, *s, flag.Args()); err != nil { 
fmt.Fprintf(os.Stderr, "echo: %v\n", err) 
os.Exit(1) 

} 


由 


func echo(newline bool, sep string, args []string) error { 


fmt.Fprint(out, strings.Join(args, sep)) 
if newline { 
fmt.Fprintln(out) 
} 
return nil 


} 


241 





在 测试 中 ， 我 们 会 通过 不 同 的 参数 和 开关 来 调用 echo， 以 检查 它 在 每 种 测试 用 例 下 得 到 
正确 的 输出 ， 所 以 我 们 还 为 echo 函数 添加 了 参数 以 避免 依赖 全 局 变量 。 也 就 是 说 ， 我 们 还 
引入 了 另外 一 个 全 局 变量 out ， 该 变量 是 io.writer 类 型 ， 所 有 的 结果 都 将 输出 到 这 里 。 通 过 
将 echo 输出 到 这 个 变量 而 不 是 直接 输出 到 os.stdout， 测 试用 例 还 可 以 用 其 他 的 替代 writer 


package main 


import ( 
"bytes" 
"fmt" 
"testing" 
) 


func TestEcho(t *testing.T) { 
var tests = []struct { 
newline bool 


sep string 
args []string 
want string 


}{ 
{true, "", []string{}, "\n"}, 
{false, "", []string{}, ""}, 


{true, "\t", [J]string{"one", "two", "three"}, "one\ttwo\tthree\n"}, 
{true, ",", [Jstring{"a”", "b", "c"}, "a,b,c\n"}, 


{false, ":", [J]string{"1", "2", "3"}, "1:2:3"}), 
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for _, test := range tests { 
descr := fmt.Sprintf("echo(%v, %q, %q)", 
test.newline, test.sep, test.args) 


out = new(bytes.Buffer) // 捕获 的 输出 


if err := echo(test.newline, test.sep, test.args); err != nil { 
t.Errorf("%s failed: %v", descr, err) 
continue 

} 


got := out.(*bytes.Buffer).String() 
if got != test.want { 
t.Errorf("%s = %q, want %q", descr, got, test.want) 
. 
} 
} 
注意 ， 测 试 代码 和 产品 代码 在 一 个 包 里 面 。 尽 管 包 的 名 称 叫 作 main， 并 且 里 面 定义 了 一 
个 main 函数 ， 但 是 在 测试 过 程 中 ， 这 个 包 当 作 库 来 测试 ， 并 且 将 函数 TestEcho 递送 到 测试 
驱动 程序 ， 而 main 函数 则 被 忽略 了 。 
通过 表 来 组 织 测试 用 例 ， 我 们 可 以 很 容易 地 添加 新 的 测试 用 例 。 下 面 添 加 一 行 到 测试 用 
例 表 中 ， 来 看 看 测试 失败 的 时 候 发 生 了 什么 。 
{true, ","，[]string{"a","b","c"}, "a b cN\n"}，// 注意 ， 预 期 结果 是 错误 的 
运行 go test 输出 : 


$ go test gopl.io/ch11l/echo 
-- FAIL: TestEcho (6.66s) 
echo._test.go:31: echo(true, ",", ["a" "b" "c"]) = "a,b,c", want "a b c\n" 
FAIL 
FAIL gopl.io/chilil/echo 8.6886s 


错误 消息 描述 了 想 要 进行 的 操作 (使 用 了 类 似 Go 的 语法 )， 然 后 依次 是 实际 行为 和 预期 
的 结果 。 有 了 如 此 详细 的 错误 消息 ， 你 在 定位 测试 的 源 代 码 之 前 就 很 容易 了 解 错误 的 根源 了 。 

记 住 ， 在 测试 的 代码 里 面 不 要 调用 log.Fatal 或 者 os.Exit， 因 为 这 两 个 调用 会 阻止 跟踪 
的 过 程 ， 这 两 个 函数 的 调用 可 以 认为 是 main 函数 的 特权 。 如 果 有 时 候 发 生 了 未 预期 错误 或 
者 函数 崩溃 了 ， 即 使 测试 用 例 本 身 失败 了 ,测试 驱动 程序 也 可 以 继续 工作 。 预 期 的 错误 ( 比 
如 用 户 输入 的 内 容 不 合法 、 文 件 不 存在 、 配 置 不 正确 等 ) 应 该 通过 返回 一 个 非 空 的 error 值 
来 报告 。 幸 运 的 是 ，echo 程序 很 简单 ， 它 不 会 返回 一 个 非 空 的 error 值 。 


11.2.3 ”和 白 盒 测试 


测试 的 分 类 方式 之 一 是 基于 对 所 要 进行 测试 的 包 的 内 部 了 解 程 度 。 黑 盒 测试 假设 测试 者 
对 包 的 了 解 仅 通过 公开 的 API 和 文档 ， 而 包 的 内 部 逻辑 则 是 不 透明 的 。 相 反 ， 白 使 测试 可 
以 访问 包 的 内 部 函数 和 数据 结构 ， 并 且 可 以 做 一 些 常 规 用 户 无 法 做 到 的 观察 和 改动 。 例 如 ， 

盒 测 试 可 以 检查 包 的 数据 类 型 不 可 变性 在 每 次 操作 后 都 是 经 过 维护 的 。( 白 铭 这 个 名 字 是 

传统 说 法 ， 净 盒 (clear box) 的 说 法 或 许 更 准确 。) 

这 两 种 方法 是 互补 的 。 黑 盒 测 试 通常 更 加 健壮 ， 每 次 程序 更 新 后 基本 不 需要 修改 。 它 们 
也 会 帮助 测试 的 作者 关注 包 的 用 户 并 且 能 够 发 现 API 设计 的 缺陷 。 反 之 ， 白 盒 测 试 可 以 对 
实现 的 特定 之 处 提供 更 详细 的 覆盖 测试 。 

上 面 已 经 给 出 了 这 两 种 测试 方法 的 例子 。TestIspPalindrome 函数 仅 调用 导出 的 函数 
IsPalindrome， 所 以 它 是 一 个 黑 盒 测试 。TestEcho 函数 调用 echo 函数 并 且 更 新 全 局 变量 out ， 
无 论 函 数 echo 还 是 变量 out 都 是 未 导出 的 ， 所 以 它 是 一 个 白 盒 测试 。 
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在 开发 TestEcho 的 时 候 ， 我 们 修改 了 echo 函数 ， 从 而 在 输出 结果 时 使 用 一 个 包 级 别 的 
变量 ， 以 便 该 测试 用 一 个 额外 的 实现 代替 标准 输出 来 记录 后 面 要 检查 的 数据 。 通 过 同样 的 技 
术 ， 我 们 可 以 使 用 易于 测试 的 伪 实 现 来 蔡 换 部 分 产品 代码 。 这 种 伪 实 现 的 优点 是 更 易于 配置 、 
预测 和 观察 ， 并 且 更 可 靠 。 它 们 还 能 够 避免 带 来 副作用 ， 比 如 更 新 产品 数据 库 或 者 刷 信 用 卡 。 

下 面 的 代码 演示 了 向 用 户 提供 存储 服务 的 Web 服务 中 的 限额 逻辑 。 当 用 户 使 用 的 额度 
超过 90% 的 时 候 ， 系 统 自 动 发 送 一 封 告 警 邮件 。 
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package storage 


import ( 
"fmt" 
"log" 
"net/smtp" 
) 


func bytesInUse(username string) int64 { return 6 /* ... */ } 


// 邮件 发 送 者 配置 

// 注意 : 永远 不 要 把 密码 放 到 源 代 码 中 

const sender = "notifications@example.com" 
const password = "correcthorsebatterystaple" 
const hostname = "smtp.example.com" 


const template = ‘Warning: you are using %d bytes of storage, 
%dX%% of your quota.. 


func CheckQuota(username string) { 
used := bytesInUse(username) 
const quota = 1600660666068 // 1GB 
percent := 168 * used / quota 
if percent < 90 { 
return // OK 


msg := fmt.Sprintf(template, used, percent) 


auth := smtp.PlainAuth("", sender, password, hostname) 

err := smtp.SendMail(hostname+":587", auth, sender, 
[]string{username}, [J]Jbyte(msg)) 

if err != nil { 


log.Printf("smtp.SendMail(%s) failed: %s", username, err) 
} 
} 


我 们 想 测试 这 个 功能 ， 但 是 并 不 想 真 的 发 送 邮件 出 去 。 所 以 我 们 把 发 送 邮件 的 逻辑 移动 
到 独立 的 函数 中 ， 并 且 把 它 存储 到 一 个 不 可 导出 的 包 级 别 的 变量 notifyuser 中 。 
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var notifyUser = func(username，msg string) { 
auth := smtp.PlainAuth("", sender, password, hostname) 
err := smtp.SendMail(hostname+":587", auth, sender, 
[]string{username}, [J]byte(msg)) 
if err != nil { 
log.Printf("smtp.SendEmail(%s) failed: %s", username, err) 
} 
} 


func CheckQuota(username string) { 
used := bytesInUse(username) 
const quota = 1666666666 // 1GB 
percent := 166 * Used / quota 
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if percent < 90 { 
return // OK 


} 
msg := fmt.Sprintf(template, used, percent) 


notifyUser(username, msg) 


} 

现在 我 们 可 以 写 个 简单 的 测试 ， 这 个 测试 用 伪造 的 通知 机 制 而 不 是 发 送 一 封 真实 的 邮 
件 。 这 个 测试 记录 需要 通知 的 用 户 和 通知 的 内 容 。 

package storage 


import ( 
"strings" 
"testing" 

» 

func TestCheckQuotaNotifiesUser(t *testing.T) { 
var notifiedUser, notifiedMsg string 
notifyUser = func(user, msg string) { 

notifiedUser, notifiedMsg = user, msg 


} 
// .… .模拟 已 使 用 98eMB 的 情况 ... 


const user = "joe@example.org" 

CheckQuota(user) 

if notifiedUser == "" && notifiedMsg == "" { 
t.Fatalf("notifyUser not called") 


if notifiedUser != user { 
t.Errorf("wrong user (%s) notified, want %s", 
notifiedUser, user) 


} 
const wantSubstring = "98% of your quota" 
if !strings.Contains(notifiedMsg, wantSubstring) { 
t.Errorf("unexpected notification message <<%s>>, "+ 
"want substring %q", notifiedMsg, wantSubstring) 


} 
} 


这 里 有 一 个 问题 ， 在 这 个 测试 函数 返回 之 后 ，checkQuota 因为 仍然 使 用 该 测试 的 伪 通知 
实现 notifyuser， 所 以 再 次 在 其 他 测试 中 调用 它 时 就 不 能 正常 工作 了 。( 对 于 全 局 变量 的 更 新 
一 直 都 是 存在 风险 的 )。 我 们 必须 修改 这 个 测试 让 它 恢复 notifyuser 原来 的 值 ， 这 样 后 面 的 
测试 才 不 会 受 影响 。 我 们 必须 在 所 有 的 测试 执行 路 径 上 面 都 这 样 做 ， 包 括 测试 失败 和 宕 机 。 
通常 这 种 情况 下 建议 使 用 defer。 

func TestCheckQuotaNotifiesUser(t *testing.T) { 

// 保存 留待 恢复 的 notifyUser 


saved := notifyUser 
defer func() { notifyUser = saved }() 


// 设置 测试 的 伪 通 知 notifyUser 

var notifiedUser, notifiedMsg string 

notifyUser = func(user, msg string) { 
notifiedUser, notifiedMsg = user, msg 


} 
// .…. 测 试 其 余 的 部 分 ... 
} 
这 种 方式 可 以 用 来 临时 保存 并 恢复 各 种 全 局 变量 包括 命令 行 选项 、 调 试 参数 ， 以 及 性 
能 参数 ， 也 可 以 用 来 安装 和 移 除 钩子 程序 来 让 产品 代码 调用 测试 代码 ; 或 者 将 产品 代码 设置 
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为 少见 却 很 重要 的 状态 ， 比 如 超时 、 错 误 ， 甚 至 是 交叉 并 行 执行 。 
以 这 种 方式 来 使 用 全 局 变量 是 安全 的 ， 因 为 go test 一 般 不 会 并 发 执行 多 个 测试 。 


11.2.4 外 部 测试 包 


考虑 包 net/url， 这 个 包 提 供 了 URL 解析 功能 ， 还 有 net/http， 这 个 包 提 供 了 Web 服 
务 器 和 HTTP 客户 端 库 。 如 我 们 所 知 ， 高 级 的 net/http 包 依赖 于 低级 的 net/url 包 。 然 而 ， 
net/url 包 中 的 一 个 测试 是 用 来 演示 URL 和 HTTP 库 之 间 进 行 交 互 的 例子 。 换 句 话 说， 低级 
别 包 的 测试 导入 了 高 级 别 包 。 

在 net/url 包 中 声明 这 个 测试 函数 会 导致 包 循环 引用 ， 如 图 11-1 中 向 上 的 箭头 所 示 ， 但 
是 10.1 节 讲 过 ，Go 规范 禁止 循环 引用 。 

我 们 通过 将 这 个 测试 函数 定义 在 外 部 测试 包 中 来 解决 这 个 问题 。 也 就 是 说 ， 在 net/url 
目录 中 ， 有 一 个 文件 ， 它 的 包 声 明 是 url_test。 这 个 额外 的 后 缀 _test 告诉 go test 工具 ， 它 
应 该 单独 地 编译 一 个 包 ， 这 个 包 仅 包含 这 些 文件 ， 然 后 运行 它 的 测试 。 为 了 帮助 理解 ， 你 可 
以 认为 这 个 外 部 测试 包 的 导入 路 径 是 net/url_test， 但 事实 上 它 无 法 通过 该 路 径 以 及 其 他 任 
何 路 径 导 入 。 

由 于 外 部 测试 在 一 个 单独 的 包 里 面 ， 因 此 它们 也 可 以 引用 一 些 依赖 于 被 测试 包 的 帮助 
包 ; 这 个 是 包 内 测试 无 法 做 到 的 。 从 设计 层次 来 看 ， 外 部 测试 包 逻 辑 上 在 它 所 依赖 的 两 个 包 
之 上 ， 如 图 11-2 所 示 。 


net/url_test 













图 11-1 net/url 的 一 个 测试 依赖 net/http 图 11-2 外 部 测试 包 打破 了 循环 引用 


为 了 避免 包 循环 导入 ， 外 部 测试 包 人 允许 测试 用 例 ， 尤 其 是 集成 测试 用 例 (用 来 测试 多 个 
组 件 的 交互 )， 自 由 地 导入 其 他 的 包 ， 就 像 一 个 应 用 程序 那样 。 

可 以 使 用 go list 工具 来 汇总 一 个 包 目 录 中 哪些 是 产品 代码 ， 哪 些 是 包 内 测试 以 及 哪些 
是 外 部 测试 。 我 们 用 fmt 包 来 作为 例子 。GoFiles 是 包含 产品 代码 的 文件 列表 ， 这 些 文件 是 
go _ build 命令 将 编译 进 你 程序 的 代码 。 


$ go list -f={{.GoFiles}} fmt 
[doc.go format.go print.go scan.go] 


TestGoFiles 是 也 属于 包 fmt 的 文件 列表 ， 但 是 这 些 以 _test.go 结尾 的 文件 仅 在 编译 测试 
的 时 候 才 会 使 用 。 

$ go list -f={{.TestGoFiles}} fmt 

[export_test.go] 

包 的 测试 用 例 通 常 位 于 这 些 文件 中 ， 而 fmt 包 却 并 不 是 这 样 。 后 面 会 解释 文件 export_ 
test.go 的 作用 。 

xTestGoFiles 是 包 外 部 测试 文件 列表 ， 比 如 fmt_test， 所 以 这 些 文件 必须 引用 fmt 包 才 
能 使 用 它 。 同 样 ， 它 们 仅 用 在 测试 过 程 中 。 
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$ go list -f={{.XTestGoFiles}} fmt 

[fmt_test.go scan_test.go stringer_test.go] 

有 时 候 ， 外 部 测试 包 需 要 对 待 测试 包 拥 有 特殊 的 访问 权限 ， 例 如 为 了 避免 循环 引用 ， 一 
个 白 盒 测试 必须 存在 于 一 个 单独 的 包 中 。 在 这 种 情况 下 ,我 们 使 用 一 种 小 技巧 : 在 包 内 测试 
文件 -test.go 中 添加 一 些 函 数 声明 ， 将 包 内 部 的 功能 暴露 给 外 部 测试 。 这 些 文件 也 因此 为 测 
试 提供 了 包 的 一 个 “后 门 ”。 如 果 一 个 源 文 件 存在 的 唯一 目的 就 在 于 此 ， 并 且 自己 不 包含 任 
何 测试 ， 它 们 一 般 称 作 export_test .go。 

例如 ， 包 fmt 的 实现 需要 功能 unicode.isspace 作为 fmt.scanf 的 一 部 分 。 为 了 避免 创建 
不 合理 的 依赖 ，fmt 没有 导入 unicode 包 及 其 巨大 的 数据 表 ， 而 是 包含 了 一 个 更 加 简单 的 实 
现 isspace。 

为 了 确保 fmt.isspace 和 unicode.Isspace 的 功能 一 致 ，fmt 添加 了 一 个 测试 。 这 个 是 包 外 
部 测试 ， 所 以 它 不 能 够 直接 访问 isspace， 所 以 fmt 通过 定义 一 个 可 导出 变量 来 引用 isspace 
函数 。 这 个 就 是 fmt 包 中 文件 export_test.go 的 内 容 。 

package fmt 


var IsSpace = isSpace 


这 个 测试 文件 没有 定义 测试 ; 它 仅 定义 了 一 个 导出 符号 fmt.Isspace 用 来 给 外 部 测试 使 
用 。 这 个 技巧 在 任何 外 部 测试 需要 使 用 白 盒 测试 技术 的 时 候 都 可 以 使 用 。 


11.2.5 ”编写 有 效 测试 


er et ttre dk eve 
测试 函数 的 机 制 (一 般 通 过 反射 或 者 元 数据 )， 在 测试 前 后 执行 测试 “启动 ”和 “销毁 ” 
a 
的 方式 ) 提供 工具 方法 的 库 。 虽 然 这 些 机 制 可 以 让 测试 编写 更 加 精细 ， 但 是 导致 的 结果 是 这 
些 测 试看 上 去 像 是 用 一 门 其 他 的 语言 编写 的 。 而 且 ， 尽 管 它们 也 能 准确 地 报告 测试 结果 是 
PASS 还 是 FAIL， 但 是 报告 的 方式 对 可 怜 的 维护 者 来 讲 或 许 并 不 友好 ， 比 如 模糊 的 错误 消息 
"assert: 8==1" 或 者 一 页 页 的 跟踪 栈 信息 。 

Go 对 测试 的 看 法 是 完全 不 同 的 。 它 期 望 测试 的 编写 者 自己 来 做 大 部 分 的 工作 ， 通 过 定 
义 函 数 来 避免 重复， 就 像 他 们 为 普通 程序 所 做 的 那样 。 测 试 的 过 程 不 是 死记 硬 背 地 填 表 格 ; 
测试 也 是 有 用 户 界 面 的 ， 虽 然 它 的 用 户 也 是 它 的 维护 者 。 一 个 好 的 测试 不 会 在 发 生 错误 时 崩 
溃 而 是 输出 该 问题 一 个 简洁 、 清 晰 的 现象 描述 ， 以 及 其 他 与 上 下 文 相 关 的 信息 。 理 想 情况 
下 ， 维 护 者 不 需要 再 通过 阅读 源 代码 来 探究 测试 失败 的 原因 。 一 个 好 的 测试 不 应 该 在 发 现 一 
次 测试 失败 后 就 终止 ， 而 是 要 在 一 次 运行 中 尝试 报告 多 个 错误 ， 因 为 错误 发 生 的 方式 本 身 会 
揭露 错误 的 原因 。 

下 面 的 断言 函数 比较 两 个 值 ， 构 建 一 条 一 般 的 错误 消息 ， 并 且 停 止 程序 。 这 个 测试 是 正 
确 的 并 且 易 于 使 用 ， 但 是 当 它 运行 失败 的 时 候 ， 所 输出 的 错误 消息 毫 无 用 处 。 它 没有 解决 一 
个 重要 问题 ， 那 就 是 提供 一 个 好 的 用 户 界 面 。 


import ( 
"fmt" 
"strings" 
"testing" 
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// 一 个 糟糕 的 断言 函数 
func assertEqual(x, y int) { 
if x != 
宕 机 (fmt.Ssprintf("%d != %d", x, y)) 
} 
} 


func TestSplit(t *testing.T) { 
words := strings.Split("a:b:c", ":") 
assertEqual(len(words), 3) 
Hf wis 

J 


在 这 种 情况 下 ， 断 言 函 数 过 早 抽 象 ， 把 这 个 特殊 测试 的 失败 当 作 两 个 整数 之 间 的 不 同 。 
我 们 丧失 了 提供 有 意义 语 境 的 机 会 。 我 们 可 以 通过 从 具体 的 信息 开始 来 提供 一 个 更 好 的 错误 
输出 ， 如 下 面 的 示例 所 示 。 只 有 重复 一 次 的 模式 出 现在 一 组 测试 中 时 才 可 以 引入 抽象 。 


func TestSplit(t *testing.T) { 


s, sep := "a:b:c", 
words := strings.Split(s, sep) 
if got, want := len(words), 3; got != want { 
t.Errorf("Split(%q, %q) returned %d words, want %d", 
s, sep, got, want) 
} 
A ns 
} 
现在 测试 函数 报告 了 调用 的 函数 名 称 、 它 的 输入 以 及 输出 表示 的 含义 ; 它 显 式 地 区 别 出 
实际 值 和 期 望 值 ; 并 且 即 使 在 测试 失败 的 情况 下 ， 它 也 可 以 继续 执行 。 当 我 们 写 出 这 种 测试 
之 后 ， 下 一 步 自然 不 是 定义 一 个 函数 来 替代 整个 if 语句 ， 而 是 在 一 个 循环 中 执行 这 个 测试 ， 
其 中 s、sep 、want 的 值 每 次 都 不 同 ， 使 用 的 是 如 IsPalindrome 那样 基于 表 的 测试 方式 。 
前 面 的 例子 并 不 需要 任何 工具 函数 ， 但 是 这 并 不 阻止 我 们 在 为 了 使 得 代码 更 简洁 的 情况 
下 引入 工具 函数 ( 13.3 节 会 给 出 一 个 工具 函数 reflect.DeepEqual)。 一 个 好 测试 的 关键 是 首 
先 实现 你 所 期 望 的 具体 行为 ， 并 且 仅 在 这 个 时 候 再 使 用 工具 函数 来 使 代码 简洁 并 且 避 免 重 
复 。 好 的 结果 很 少 是 从 抽象 的 、 通 用 的 测试 函数 开始 的 。 
练习 11.5: 扩展 Testsplit 函数 ， 以 使 用 基于 表 的 输入 和 期 望 输出 。 


11.2.6 ”避免 脆弱 的 测试 


如 果 一 个 应 用 在 遇 到 新 的 合法 输入 的 情况 下 经 常 月 演 ， 那 么 这 个 程序 是 有 缺陷 的 ; 如 果 
在 程序 发 生 可 靠 的 改动 的 时 候 测 试用 例 奇怪 地 失败 了 ， 那 么 这 个 测试 用 例 也 是 脆弱 的 。 如 
同 有 缺陷 的 程序 会 让 用 户 感到 泪 表 ， 脆 弱 的 测试 也 会 激怒 它 的 维护 者 。 最 脆弱 的 测试 在 产品 
代码 发 生 任何 改动 的 时 候 都 会 失败 ， 无 论 这 些 改动 是 好 是 坏 ， 这 些 测试 通常 称 为 变化 探测 器 
(change detector) 或 现状 探测 器 (status quo test)， 并 且 处 理 它们 花费 的 时 间 将 会 使 得 它们 曾 
经 带 来 的 好 处 消失 列 尽 。 

如 果 一 个 被 测试 的 函数 产生 了 一 个 复杂 的 输出 ， 比 如 一 个 长 字符 串 、 一 个 详细 的 数据 
结构 或 者 一 个 文件 ， 比 较 吸 引 人 的 做 法 是 检查 输出 完全 匹配 在 测试 阶段 预期 的 一 些 “ 幸 运 
值 ” 。 然 而 ， 随 着 程序 的 进化 ， 输 出 的 部 分 内 容 或 许 以 好 的 方式 将 会 发 生变 化 ， 但 是 会 发 生 改 
变 。 而 且 ， 不 仅仅 是 输出 会 变化 ， 拥 有 复杂 输入 的 函数 经 常 衣 演 ， 由 于 测试 中 使 用 的 输入 不 再 
合法 。 
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避免 写 出 脆弱 测试 的 最 简单 方法 就 是 仅 检查 你 关心 的 属性 。 首 先 测试 程序 中 越 来 越 简单 
和 稳定 的 接口 ， 然 后 是 它们 的 内 部 函数 。 选 择 性 地 设置 断言 。 例 如 不 要 检查 字符 串 精确 匹 
配 ， 而 是 寻找 在 程序 进化 过 程 中 不 会 发 生 改 变 的 子 串 。 通 常情 况 下 ， 很 值得 写 一 个 稳定 的 函 
数 来 从 复杂 的 输出 中 提取 核心 内 容 ， 只 有 这 样 断言 才 会 可 靠 。 虽 然 看 起 来 预先 会 做 很 多 工 
作 ,， 但 是 这 是 值得 的 ， 否 则 这 些 时 间 就 会 被 花 在 修复 那些 奇怪 地 失败 的 测试 上 面 。 


11.3 ”覆盖 率 


从 本 质 上 看 ， 测 试 从 来 不 会 结束 。 著 名 计算 机 科学 家 Edsger Dijkstra 说 ,“ 测 试 旨 在 发 
现 bug， 而 不 是 证 明 其 不 存在 。” 无 论 有 多 少 测试 都 无 法 证 明 一 个 包 是 没有 bug 的 。 在 最 好 的 
情况 下 ， 它 们 增强 了 我 们 的 信心 ， 这 些 包 是 可 以 在 很 多 重要 的 场景 下 使 用 的 。 

一 个 测试 套件 覆盖 待 测试 包 的 比例 称 为 测试 的 覆盖 率 。 和 覆盖 率 无 法 直接 通过 数量 来 衡 
量 ， 任 何事 情 都 是 动态 的 ， 即 使 最 微小 的 程序 都 无 法 精确 地 测量 。 但 还 是 有 办 法 帮助 我 们 将 
测试 精力 放 到 最 有 潜力 的 地 方 。 

语句 覆盖 率 是 一 种 最 简单 的 且 广 泛 使 用 的 方法 之 一 。 一 个 测试 套件 的 语句 覆盖 率 是 指 部 
分 语句 在 一 次 执行 中 至 少 执行 一 次 。 本 节 将 使 用 Go 的 cover 工具 ， 这 个 工具 被 集成 到 了 go 
test 中 ， 用 来 衡量 语句 覆盖 率 并 帮助 识别 测试 之 间 的 明显 差别 。 

下 面 的 代码 是 基于 表 的 测试 ， 用 来 测试 第 7 章 中 创建 的 表达 式 求 值 器 。 


gopl1.io/ch7/eval 
func TestCoverage(t *testing.T) { 

var tests = []struct { 
input string 
env Env 
want string // Parse/Check 返回 的 错误 或 者 Eval 返回 的 结果 

}{ 
{"x % 2", nil, "unexpected '%'"}, 
{"!true", nil, "unexpected '!'"}, 
{"log(10)", nil, “unknown function "log" }, 
{"sqrt(1, 2)", nil, "call to sqrt has 2 args, want 1"}, 
{"sqrt(A / pi)", Env{"A": 87616, "pi": math.Pi}, "167"}, 
{"pow(x, 3) + pow(y, 3)", Env{"x": 9, "y": 10}, "1729"}, 
{"5 /9 * (F - 32)", Env{"F": -40}, "-46"}, 


for _, test := range tests { 
expr, err := Parse(test.input) 
if err == nil { 
err = expr.Check(map[Var]bool{}) 
} 
if err l= nil { 
if err.Error() != test.want { 
t.Errorf("%s: got %q, want %q", test.input, err, test.want) 


continue 
} 
got := fmt.Sprintf("%.6g", expr.Eval(test.env)) 
if got != test.want { 
t.Errorf("%s: %v => %s, want %s", 
test.input, test.env, got, test.want) 
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首先 ， 检 测 测试 可 以 通过 : 
$ go test -v -run=Coverage gopl.io/ch7/eval 
=== RUN TestCoverage 
-- PASS: TestCoverage (8.66s) 
PASS 
ok gopl.io/ch7/eval 8.611s 


这 个 命令 输出 了 覆盖 工具 的 使 用 方法 : 


$ go tool cover 

Usage of “8go tool cover': 

Given a coverage profile produced by “8go test': 
go test -coverprofile=c.out 


Open a web browser displaying annotated source code: 
go tool cover -html=c.out 


命令 go tool 运 行 Go 工 具 链 里 面 的 一 个 可 执行 文件 。 这 些 程 序 位 于 $6GoR00T/pkg/ 
too1/${G00S}_${GOARCH}。 多 亏 了 go build 工具 ， 我 们 很 少 直 接 调用 它们 。 
现在 带 上 -coverprofile 标记 来 运行 测试 : 


$ go test -run=Coverage -coverprofile=c.out gopl.io/ch7/eval 
ok gopl.io/ch7/eval 0.032s coverage: 68.5% of statements 


这 个 标记 通过 检测 产品 代码 ， 启 用 了 和 覆盖 数据 收集 。 也 就 是 说 ， 它 修改 了 源 代码 的 副 
本 ， 这 样 在 每 个 语句 块 执行 之 前 ,设置 一 个 布尔 变量 ， 每 个 语句 块 都 对 应 一 个 变量 。 在 修改 
的 程序 退出 之 前 ， 它 将 每 个 变量 的 值 都 写 人 到 指定 的 c.out 日 志文 件 中 并 且 输 出 被 执行 语句 
的 汇总 信息 (如 果 你 只 需要 汇总 信息 ， 那 么 使 用 go test -cover)。 

如 果 go test 命令 指定 了 -convermode=count 标记 ， 每 个 语句 块 的 检测 会 递增 一 个 计数 器 
而 不 是 设置 布尔 量 。 关 于 每 个 块 的 执行 次 数 的 日 志 使 得 量化 比较 成 为 可 能 ， 可 由 此 识别 出 执 
行 频率 较 高 的 “ 热 块 ”或 者 相反 的 “ 冷 块 ”。 

在 生成 数据 之 后 ， 我 们 运行 cover 工具 ， 来 处 理 生 成 的 日 志 ， 生 成 一 个 HTML 报告 ， 并 
在 一 个 新 的 浏览 器 窗口 打开 它 〈 见 图 11-3 )。 

$ go tool cover -html=c.out 

界面 中 ， 每 个 用 绿色 (图 中 显示 为 浅 灰 色 ) 标记 的 语句 块 表示 它 被 覆盖 了 ， 而 红色 (图 
中 为 加 阴影 的 深 灰 色 ) 的 则 表示 它 没有 被 覆盖 。 为 了 清晰 起 见 ， 我 们 给 红色 的 文字 加 了 阴 
影 。 我 们 可 以 立即 看 到 ， 这 里 的 输入 都 没有 执行 一 元 操作 符 Eval 方法 。 如 果 添 加 一 个 新 的 
测试 用 例 到 表格 中 并 且 重新 运行 前 面 的 两 条 命令 ， 一 元 表达 式 代码 将 变 成 绿色 。 

{"+X * -x", eval.Env{"x": 2},"-4"} 

然而 ， 两 行 panic 语句 仍然 是 红色 。 这 个 并 不 奇怪 ， 因 为 这 些 代码 不 应 该 执行 到 。 

实现 语句 的 100% 覆盖 听 上 去 很 宏伟 ， 但 是 在 实际 情况 下 这 并 不 可 行 ， 也 不 会 行 之 有 
效 。 因 为 语句 得 以 执行 并 不 意味 着 这 是 没有 bug 的 ， 拥 有 复杂 表达 式 的 语句 块 必须 使 用 不 同 
的 输入 执行 多 次 来 覆盖 相关 用 例 。 有 一 些 语句 (如 上 面 的 panic 语句 ) 就 永远 不 会 被 执行 到 。 
其 他 的 (比如 处 理 少 见 错误 的 代码 ) 也 很 难 检测 并 且 实际 上 也 很 少 会 执行 。 测 试 基本 上 是 实 
用 主义 行为 ， 在 编写 测试 的 代价 和 本 可 以 通过 测试 避免 的 错误 造成 的 代价 之 间 进 行 平衡 。 覆 
盖 工 具 可 以 帮助 识别 最 薄弱 的 点 ， 但 是 和 编程 一 样 ， 设 计 好 的 测试 用 例 通 常 需要 一 丝 不 区 的 
精神 。 
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func (u unary) Evat(env Env) float64 { 
switch u.op { 
Case ‘+': 
return +uy.x.Eval(env) 
Case ‘~—': 
return ~u:x,Eval(env)} 


panic(fmt.Sprintf("unsupported unary operator:; %q", u.op)) 
binary) Eval(env Env) float64 { 

switch b.op { 

CaSeE “+: 


return b.x.Eval(env) + b.y.Eval(erv) 


return b.x.Eval(env) ~ b.y.Eval(env) 
bi 


return b.x.Eval(env} 水 by.Eval (env) 
prs 


return b,x,Eval(env) / by,Eval (env) 


} 
panic(fmt.Sprintf("unsupported binary operator: %q"，b,op)) 





11.4 Benchmark 函数 


基准 测试 就 是 在 一 定 的 工作 负载 之 下 检测 程序 性 能 的 一 种 方法 。 在 Go 里面， 基准 测试 
函数 看 上 去 像 一 个 测试 函数 ， 但 是 前 级 是 Benchmark 并 且 拥有 一 个 *testing.8 参数 用 来 提供 
大 多 数 和 *testing.T 相同 的 方法 ， 人 额外 增加 了 一 些 与 性 能 检测 相关 方法 。 它 还 提供 了 一 个 整 
型 成 员 N， 用 来 指定 被 检测 操作 的 执行 次 数 。 

这 里 是 IsPlindrome 函数 的 基准 测试 ， 它 在 一 个 循环 中 调用 了 IsPalindrome 共 N 次 。 


import "testing" 


func BenchmarkIsPalindrome(b *testing.B) { 
for i := 80; ix b.N; i++{ 
Ispalindrome( "A man, a plan, a canal: Panama") 
} 
} 


我 们 使 用 下 面 的 命令 执行 它 。 和 测试 不 同 ， 默 认 情况 下 不 会 运行 任何 基准 测试 。 标 
记 -bench 的 参数 指定 了 要 运行 的 基准 测试 。 它 是 一 个 匹配 Benchmark 函数 名 称 的 正则 表达 
式 ， 它 的 默认 值 不 匹配 任何 函数 。 模 式 “ .” 使 它 匹配 包 word 中 所 有 的 基准 测试 函数 ， 因 为 
这 里 只 有 一 个 基准 测试 函数 ， 所 以 和 指定 -bench=IsPalindrome 效果 一 样 。 


$ cd $GOPATH/src/gopl.io/ch11/word2 
$ go test -bench=. 


PASS 
BenchmarkIsPalindrome-8 1666666 1635 ns/op 
ok gopl.io/ch11/word2 2.179s 


基准 测试 名 称 的 数字 后 缀 8 表示 GomaxProcs 的 值 ， 这 个 对 于 并 发 基准 测试 很 重要 。 
报告 告诉 我 们 每 次 IsPalindrome 调用 耗费 1.035ms， 这 个 是 1 000 000 次 调用 的 平均 值 。 
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因为 基准 测试 运行 器 开始 的 时 候 并 不 清楚 这 个 操作 的 耗 时 长 短 ， 所 以 开始 的 时 候 它 使 用 了 比 
较 小 的 N 值 来 做 检测 ， 然 后 为 了 检测 稳定 的 运行 时 间 ， 推 断 出 足够 大 的 入 值 。 

使 用 基准 测试 函数 来 实现 循环 而 不 是 在 测试 驱动 程序 中 调用 代码 的 原因 是 ， 在 基准 测试 
函数 中 在 循环 外 面 可 以 执行 一 些 必要 的 初始 化 代码 并 且 这 段 时 间 不 加 到 每 次 迭代 的 时 间 中 。 
如 果 初 始 化 代码 干扰 了 结果 ， 参 数 testing.B 提供 了 方法 用 来 停止 、 恢 复 和 重 置 计时 器 ,但 
是 这 些 方法 很 少 用 到 。 

既然 有 了 基准 测试 和 功能 测试 ， 这 时 就 很 容易 想到 让 程序 更 快 一 点 。 或 许 最 明显 的 优化 
是 使 得 IsPalindrome 函数 的 第 二 次 循环 在 中 间 停 止 检 测 ， 以 避免 比较 两 次 : 


n := len(letters)/2 
fori:=0; ix ni i++{ 
if letters[i] != letters[len(letters)-1-i] { 
return false 
} 
} 


return true 
但 是 通常 情况 下 ， 优 化 并 不 能 总 是 带 来 期 望 的 好 处 。 这 个 优化 在 一 次 实验 中 仅 带 来 了 
4% 的 性 能 提升 。 


$ go test -bench=. 

PASS 

BenchmarkIsPalindrome-8 1666666 992 ns/op 
ok gopl.io/ch11/word2 2.893s 


另外 一 个 主意 是 为 letters 预 分 配 一 个 容量 足够 大 的 数组 ， 而 不 是 通过 连续 的 append 调 
用 来 追加 。 像 这 样 声明 一 个 合适 长 度 的 数组 letters: 

letters := make([Jrune, 86, len(s)) 

for _,r := range st{ 


if unicode.IsLetter(r) { 
letters = append(letters, unicode.ToLower(r)) 


} 
} 


这 个 改进 带 来 了 35% 的 性 能 提升 ， 另 外 基准 测试 运行 器 报告 了 2 000 000 次 运行 时 间 的 
平均 值 。 


$ go test -bench=. 

PASS 

BenchmarkIsPalindrome-8 2666666 697 ns/op 
ok gopl.io/ch11/word2 1.468s 


如 上 面 的 例子 所 示 ， 最 快 的 程序 通常 是 那些 进行 内 存 分 配 次 数 最 少 的 程序 。 命 令 行 标 
记 -benchmem 在 报告 中 包含 了 内 存 分 配 统计 数据 。 这 里 和 优化 之 前 的 内 存 分 配 进行 比较 : 


$ go test -bench=. -benchmem 


PASS 

BenchmarkIsPalindrome 1666666 1626 ns/op 384 B/op 4 allocs/op 
优化 之 后 : 

$ go test -bench=. -benchmem 

PASS 


BenchmarkIsPalindrome 26886666 867 ns/op 128 B/op 1 allocs/op 


在 一 次 make 调用 中 分 配 完全 部 所 需 的 内 存 减 少 了 75% 的 分 配 次 数 并 且 减 少 了 一 半 的 内 


22 锚 11 蝎 


存 分 配 。 

这 种 基准 测试 告诉 我 们 给 定 操作 的 绝对 耗 时 ， 但 是 在 很 多 情况 下 ， 引 起 关注 的 性 能 问题 
是 两 个 不 同 操作 之 间 的 相对 耗 时 。 例 如 ， 如 果 一 个 函数 需要 lms 来 处 理 1000 个 元 素 ， 那 么 
它 处 理 10 000 个 或 者 100 万 个 元 素 需 要 多 久 呢 ? 另外 一 个 例子 : IO 缓冲 区 的 最 佳 大 小 是 多 
少 。 对 一 个 应 用 使 用 一 系列 的 大 小 进行 基准 测试 可 以 帮助 我 们 选择 最 小 的 缓冲 区 并 带 来 最 佳 
的 性 能 表现 。 第 三 个 例子 : 对 于 一 个 任务 来 讲 ， 哪 种 算法 表现 最 佳 ? 对 两 个 不 同 的 算法 使 用 
相同 的 输入 ， 在 重要 的 或 者 具有 代表 性 的 工作 负载 下 ， 进 行 基准 测试 通常 可 以 显示 出 每 个 算 
法 的 优点 和 缺点 。 

性 能 比较 函数 只 是 普通 的 代码 。 它 们 的 表现 形式 通常 是 带 有 一 个 参数 的 函数 ， 被 多 个 不 
同 的 Benchmark 函数 传 入 不同 的 值 来 调用 ， 如 下 所 示 : 


func benchmark(b *testing.B, size int) { /* ... */ } 
func Benchmark16(b *testing.B) { benchmark(b，16) } 
func Benchmark166(b *testing.B) { benchmark(b，166) } 
func Benchmark1666(b *testing.B) { benchmark(b，1666) } 


参数 size 指定 了 输入 的 大 小 ， 每 个 Benchmark 函数 传人 的 值 都 不 同 但 是 在 每 个 函数 内 部 
是 一 个 常量 。 不 要 使 用 bN 作 为 输入 的 大 小 。 除 非 把 它 当 作 固 定 大 小 输入 的 循环 次 数 ， 否 则 
该 基准 测试 的 结果 毫 无 意义 。 

基准 测试 比较 揭示 的 模式 在 程序 设计 阶段 很 有 用 处 ， 但 是 即使 程序 正常 工作 了 ， 我 们 也 
不 会 丢掉 基准 测试 。 随 着 的 程序 演变 ， 或 者 它 的 输入 增长 了 ， 或 者 它 被 部 署 在 其 他 的 操作 系 
统 上 并 拥有 一 些 新 特性 ， 我 们 仍然 可 以 重用 基准 测试 来 回顾 当初 的 设计 决策 。 

练习 11.6 : 编写 基准 测试 来 比较 2.6.2 节 实 现 的 Popcount 和 练习 2.4 和 2.5 的 答案 。 在 
何 种 情况 下 ， 基 于 表 的 测试 方法 付出 和 收益 均衡 。 

练习 11.7 : 使 用 大 型 伪 随 机 输入 ,为 6.5 节 中 *Intset 的 Add、unionwith 和 其 他 的 方 
法 编写 基准 测试 。 你 能 让 这 些 方法 运行 多 快 ? 单词 长 度 的 选择 对 性 能 具有 什么 影响 ”这 个 
Intset 的 性 能 比 使 用 内 置 map 类 型 实现 的 功能 快 多 少 ? 


11.5 性 能 剖析 

基准 测试 对 检测 具体 操作 的 性 能 很 有 用 ， 但 是 当 我 们 在 尝试 使 得 一 个 程序 变 得 更 快 的 时 
候 ， 我 们 经 常 不 知道 从 何 做 起 。 每 个 程序 员 都 了 解 关 于 唐纳德 . 克 努 斯 的 不 要 过 早 优化 的 篇 
言 ， 这 句 话 出 现在 1974 年 的 “ Structured Programming with go to Statements ”一 文中 。 虽 
然 经 常 被 误解 为 性 能 并 不 重要 ,但 是 我 们 可 以 从 原始 的 语 境 中 得 出 如 下 信息 : 

宫 无 疑问 对 性 能 的 党 拜会 导致 滥用 。 程 序 员 们 浪费 了 大 量 的 时 间 来 思考 或 担心 他 们 非 关 
键 部 分 代码 的 执行 速度 ， 并 且 在 考虑 到 程序 的 调试 和 维护 的 时 候 这 些 优化 的 尝试 事实 上 会 带 
来 负面 的 影响 。 我 们 必须 忘记 微小 的 性 能 提升 ， 必 须 说 在 97% 的 情况 下 ， 过 早 优 化 是 万 亚 
之 源 。 

然而 我 们 不 可 以 错过 那 关 键 的 3% 的 情况 。 一 个 好 的 程序 员 不 会 因为 这 个 就 自满 ， 明 智 
的 方法 是 他 应 该 仔细 地 查看 关键 代码 ; 当然 仅 在 关键 代码 明确 之 后 。 通 常情 况 下 先入 为 主 地 
认定 程序 哪些 部 分 是 关键 代码 是 错误 的 ， 使 用 了 检测 工具 的 程序 员 会 发 现 的 普遍 经 验 就 是 他 
们 的 直觉 是 错 的 。 

当 我 们 希望 仔细 地 查看 程序 的 速度 时 ， 发 现 关 键 代 码 的 最 佳 技 术 就 是 性 能 剖析 。 性 能 剖 
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析 是 通过 自动 化 手段 在 程序 执行 过 程 中 基于 一 些 性 能 事件 的 采样 来 进行 性 能 评测 ， 然 后 再 从 
这 些 采 样 中 推断 分 析 ， 得 到 的 统计 报告 就 称 作为 性 能 剖析 (profile)。 

Go 支持 很 多 种 性 能 剖析 方式 ， 每 一 个 都 和 一 个 不 同方 面 的 性 能 指标 相关 ， 但 是 它们 都 
需要 记录 一 些 相 关 的 事件 ， 每 一 个 都 有 一 个 相关 的 栈 信息 一 一 在 事件 发 生 时 活跃 的 函数 调用 
栈 。 工 具 go test 内 置 支持 一 些 类 别 的 性 能 剖析 。 

CPU 性 能 剖析 识别 出 执行 过 程 中 需要 CPU 最 多 的 函数 。 在 每 个 CPU 上 面 执行 的 线程 都 
每 隔 几 毫秒 会 定期 地 被 操作 系统 中 断 ， 在 每 次 中 断 过 程 中 记录 一 个 性 能 剖析 事件 ， 然 后 恢复 
正常 执行 。 

堆 性 能 剖析 识别 出 负责 分 配 最 多 内 存 的 语句 。 性 能 剖析 库 对 协 程 内 部 内 存 分 配 调用 进行 
采样 ， 因 此 每 个 性 能 剖析 事件 平均 记录 了 分 配 的 512KB 内 存 。 

阻塞 性 能 剖析 识别 出 那些 阻塞 协 程 最 久 的 操作 ， 例 如 系统 调用 ， 通 道 发 送 和 接收 数据 ， 
以 及 获取 锁 等 。 性 能 分 析 库 在 一 个 goroutine 每 次 被 上 述 操 作 之 一 阻塞 的 时 候 记录 一 个 事件 。 

获取 待 测试 代码 的 性 能 剖析 报告 很 容易 ， 只 需要 像 下 面 一 样 指定 一 个 标记 即 可 。 当 一 次 
使 用 多 个 标记 的 时 候 需 要 注意 ， 获 取 性 能 分 析 报 告 的 机 制 是 当 获 取 其 中 一 个 类 别 的 报告 时 会 
覆盖 掉 其 他 类 别 的 报告 。 


$ go test -cpuprofile=cpu.out 

$ go test -blockprofile=block.out 

$ go test -memprofile=mem.out 

尽管 具体 的 做 法 对 于 短暂 的 命令 行 工具 和 长 时 间 运 行 的 服务 器 程序 有 所 不 同 ， 但 是 为 非 
测试 程序 添加 性 能 剖析 支持 也 很 容易 。 性 能 剖析 对 于 长 时 间 运 行 的 程序 尤其 有 用 ， 所 以 Go 
运行 时 的 性 能 剖析 特性 可 以 让 程序 员 通 过 runtime API 来 启用 。 

在 我 们 获取 性 能 剖析 结果 后 ， 我 们 需要 使 用 pprof 工具 来 分 析 它 。 这 是 Go 发 布 包 的 标 
准 部 分 ， 但 是 因为 不 经 常 使 用 ， 所 以 通过 go tool pprof 间接 来 使 用 它 。 它 有 很 多 特性 和 选 
项 ， 但 是 基本 的 用 法 只 有 两 个 参数 ， 产 生性 能 剖析 结果 的 可 执行 文件 和 性 能 剖析 日 志 

为 了 使 得 性 能 剖析 过 程 高 效 并 且 节 约 空间 ， 性 能 齐 析 日 志 里 面 没有 包含 函数 名 称 而 是 使 
用 它们 的 地 址 。 这 就 意味 着 pprof 工具 需要 可 执行 文件 才能 理解 数据 内 容 。 虽 然 通常 情况 下 
go test 工具 在 测试 完成 之 后 就 丢弃 了 用 于 测试 而 临时 产生 的 可 执行 文件 ， 在 性 能 剖析 启用 
的 时 候 ， 它 保存 并 把 可 执行 文件 命名 为 foo.test， 其 中 foo 是 被 测试 包 的 名 字 。 

下 面 的 命令 演示 如 何 获取 和 显示 简单 的 CPU 性 能 剖析 。 我 们 选择 了 net/http 包 中 的 一 
个 基准 测试 。 通 常情 况 下 最 好 对 我 们 关心 的 具有 代表 性 的 具体 负载 而 构建 的 基准 测试 进行 性 
能 性 能 剖析 。 对 测试 用 例 进 行 基准 测试 永远 没有 代表 性 ， 这 也 是 我 们 使 用 过 滤器 -run=NONE 
来 禁用 它们 的 原因 。 

$ go test -run=NONE -bench=ClientServerParallelTLS64 \ 

-cpuprofile=cpu.log net/http 
PASS 
BenchmarkClientServerParallelTLS64-8 1666 


3141325 ns/op 143616 B/op 1747 allocs/op 
ok net/http 3.395s 


$ go tool pprof -text -nodecount=16 ./http.test cpu.log 
2576ms of 3596ms total (71.59%) 
Dropped 129 nodes (cum <= 17.95ms) 
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Showing top 16 nodes out of 166 (cum >= 66ms) 
flat flat% sum% Cum cum% 
1736ms 48.19% 48.19% 1756ms 48.75% crypto/elliptic.p256ReduceDegree 
236ms 6.41% 54.66% 256ms 6.96% crypto/elliptic.p256Diff 
126ms 3.34% 57.94% ”126ms 3.34% math/big.addMulVVW 
116ms 3.66% 61.66% ”116ms 3.66% syscall.Syscall 
96ms 2.51% 63.51% 1136ms 31.48% crypto/elliptic.p256Square 
76ms 1.95% 65.46% 126ms 3.34% runtime.scanobject 
66ms 1.67% 67.13% “836ms 23.12% crypto/elliptic.p256Mul 
66ms 1.67% 68.86% 196ms 5.29% math/big.nat.montgomery 
56ms 1.39% 78.19% 56ms 1.39% crypto/elliptic.p256ReduceCarry 
56ms 1.39% 71.59% 66ms 1.67% crypto/elliptic.p256Sum 
标记 -text 指定 输出 的 格式 ， 在 这 个 例子 中 ， 首 先 出 现 的 是 一 个 文本 表格 ， 表 格 中 每 行 
一 个 函数 ， 这 些 函 数 是 根据 消耗 CPU 最 多 的 规则 排序 的 “ 热 函 数 ”。 标 记 -nodecount=1e 限 
制 输出 的 结果 共 10 行 。 对 于 较 明 显 的 性 能 问题 ， 这 个 文本 格式 的 输出 或 许 已 经 足够 暴露 问 
题 了 。 
这 个 性 能 剖析 结果 告诉 我 们 对 于 这 个 特定 的 HTTPS 基准 测试 的 性 能 来 说 椭圆 曲线 密码 
学 很 重要 。 作 为 对 比 ， 如 果 一 个 性 能 剖析 结果 主要 由 runtime 包 中 的 内 存 分 配 函 数控 制 ， 那 
么 减少 内 存 消 耗 是 一 个 有 价值 的 优化 。 
对 于 更 微妙 的 问题 ， 最 好 使 用 pprof 的 图 形 显示 格式 之 一 。 这 些 格式 需要 GraphViz， 
它 可 以 从 www.graphviz.org 下 载 。 标 记 -web 泻 染 了 程序 中 函数 的 有 向 图 ， 并 标记 出 函数 的 
CPU 消耗 数值 ， 用 颜色 突出 “ 热 函 数 ”。 
这 里 只 讨论 了 Go 的 性 能 剖析 工具 的 皮毛 。 要 了 解 更 多 内 容 ， 可 以 阅读 Go 博客 文章 


“Go 程序 性 能 检测 ”。 


11.6 ” Example 函数 


被 go test 特殊 对 待 的 第 三 种 函数 就 是 示例 函数 ， 它 们 的 名 字 以 Example 开头 。 它 既 没 
有 参数 也 没有 结果 。 这 里 有 IsPalindrome 的 一 个 示例 函数 : 


func ExampleIsPalindrome() { 
fmt.Println(IsPalindrome("A man, a plan, a canal: Panama")) 
fmt.Println(IsPalindrome("palindrome")) 
// 输出 : 
// true 
// false 


} 


示例 函数 有 三 个 目的 。 首 要 目的 是 作为 文档 ; 比 起 乏味 的 描述 ， 举 一 个 好 的 例子 是 描述 
库 函 数 功能 最 简洁 直观 的 方式 。 示 例 也 可 以 用 来 演示 同一 API 中 的 类 型 和 函数 之 间 的 交互 ， 
而 文档 则 总 是 要 重点 介绍 某 个 点 ， 要 么 是 类 型 ， 要 么 是 函数 或 者 整个 包 。 和 带 注释 的 例子 
不 同 ， 示 例 函 数 是 真实 的 Go 代码 ， 必 须 通 过 编译 时 检查 ， 所 以 随 着 代码 的 进化 它们 也 不 会 
过 时 。 

.基于 Example 函数 的 后 级， 基于 Web 的 文档 服务 器 godoc 可 以 将 示例 函数 和 它 所 演示 的 
函数 或 包 相 关联 ， 因 此 ExampleIsPalindrome 将 和 函数 IsPalindrome 的 文档 显示 在 一 起 ， 同 时 
如 果 有 一 个 示例 函数 就 叫 Example， 那 么 它 就 和 包 word 关联 在 一 起 。 

示例 函数 的 第 二 个 目的 是 它们 是 可 以 通过 go test 运行 的 可 执行 测试 。 如 果 一 个 示例 函 
数 最 后 包含 一 个 类 似 这 样 的 注释 // 输出 :， 测 试 驱动 程序 将 执行 这 个 函数 并 且 检 查 输 出 到 终 


测 就 2 


端的 内 容 匹 配 这 个 注释 中 的 文本 。 

示例 函数 的 第 三 个 目的 是 提供 手动 实验 代码 。 在 golang.org 上 的 godoc 文档 服务 器 使 用 
Go Playground 来 让 用 户 在 Web 浏览 器 上 面 编辑 和 运行 每 个 示例 函数 ， 如 图 11-4 所 示 。 这 个 
通常 是 了 解 特定 函数 功能 或 者 了 解 语 言 特 性 最 快捷 的 方法 。 


func Join 


func Join(a [lstring, se string) string 


Join concatenates the elements of a to create a single string. The separator string 
sep is placed between elements in the resulting string. 


v Example 





package main 
import ( 
"fmt 


"strings" 
) 


func main() { 
s := []string{"foo", "bar”, "baz"} 
fmt,.Printin(strings.Join(s, ", ")) 
} 





foo, bar, baz 


Program exited, 














[en] [For [oe 





图 11-4 strings.Join 在 godoc 中 的 交互 式 例子 


本 书 最 后 两 章 讲解 reflect 包 和 unsafe 包 ， 这 两 个 包 很 少 会 有 Go 程序 员 使 用 一 一 当然 
也 很 少 会 需要 用 到 。 如 果 读 到 这 里 ， 你 还 没有 写 过 任何 Go 程序 ， 现 在 就 可 以 开始 了 。 
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The Go Programming Language 


反 射 





o 语言 提供 了 一 种 机 制 ， 在 编译 时 不 知道 类 型 的 情况 下 ， 可 更 新 变量 、 在 运行 时 查看 
值 、 dst 它们 的 布局 进行 操作 ， 这 种 机 制 称 为 反射 ( reflection)。 反 射 也 让 
我 们 可 以 把 类 型 当做 头等 值 。 
本 章 将 探讨 Go 语言 的 反射 功能 以 及 它 如 何 增强 语言 的 表达 能 力 ， 特 别 是 它 在 实现 
两 个 重要 API 中 的 关键 作用 。 这 两 个 API 分 别 是 fmt 包 提 供 的 字符 串 格 式 化 功能 ， 以 及 
encoding/json 和 encoding/xml 这 种 包 提 供 的 协议 编码 功能 。 反 射 在 text/template 和 html/ 
template 包 提 供 的 模板 机 制 (参见 4.6 节 ) 中 也 很 重要 。 另 外 ， 反 射 的 推导 比较 复杂 ， 也 不 
是 为 了 随意 使 用 设计 的 ， 因 此 尽管 这 些 包 使 用 反射 来 实现 ， 但 它们 并 没有 在 自己 的 API 中 
暴露 反射 。 


12.1 为 什么 使 用 反射 


有 了 时 我 们 需要 写 一 个 函数 有 能 力 统一 处 理 各 种 值 类 型 的 函数 ， 而 这 些 类 型 可 能 无 法 共享 
同一 个 接口 ， 也 可 能 布局 未 知 ， 也 有 可 能 这 个 类 型 在 我 们 设计 函数 时 还 不 存在 ， 其 至 这 个 类 
型 会 同时 存在 上 面 三 种 问题 。 

一 个 熟悉 的 例子 是 fmt.Printf 中 的 格式 化 逻辑 ， 它 可 以 输出 任意 类 型 的 任意 值 ， 甚 至 是 
用 户 自 定 义 的 一 个 类 型 。 让 我 们 先 尝 试用 我 们 已 学 到 的 知识 来 实现 一 个 类 似 的 函数 。 为 了 简 
化 起 见 ， 该 函数 只 接受 一 个 参数 ， 并 且 与 fmt.sprint 一 样 返回 一 个 字符 串 ， 所 以 我 们 称 这 个 
函数 为 Sprint。 

我 们 先 用 一 个 类 型 分 支 来 判断 这 个 参数 是 否定 义 了 一 个 string 方法 ， 如 果 已 定义 则 直 
接 调 用 它 。 然 后 添加 一 些 switch 分 支 来 判断 参数 的 动态 类 型 是 否 是 基本 类 型 (比如 string、 
int 、bool 等 )， 再 对 每 种 类 型 采用 不 同 的 格式 化 操作 。 


func Sprint(x interface{}) string { 
type stringer interface { 
String() string 


} 
switch x := x.(type) { 
case stringer: 

return x.String() 
case string: 

return x 
case int: 

return strconv.Itoa(x) 

.. 对 int16、uint32 等 类 型 做 类 似 的 处 理 

case ‘bool: 

Ef XxX{ 

return “true” 


return "false" 
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default: 
// array、 chan、 func、 map、 pointer、 slice、 struct 
returm "2?Y72™ 
} 
i 


但 我 们 如 何 处 理 类 似 []float64、map[string][]string 的 其 他 类 型 呢 ? 可 以 添加 更 多 的 分 
支 ， 但 这 样 的 类 型 有 无 限 种 。 更 何况 还 有 自己 命名 的 类 型 ， 比 如 url.values ? 因为 即使 我 们 
有 一 个 分 支 来 处 理 map[string][]string (url.Vallues 的 底层 类 型 )， 这 个 分 支 仍然 不 会 处 理 
url.Values ， 因 为 这 两 个 类 型 不 是 完全 一 致 的 。 更 何况 根本 不 可 能 引入 url.values 的 处 理 分 
支 ? 因为 这 会 导致 库 依赖 于 库 的 客户 ( 即 循环 引用 )。 

当 我 们 无 法 透视 一 个 未 知 类 型 的 布局 时 ， 这 段 代 码 就 无 法 继续 ， 这 时 我 们 就 需要 反 
射 了 。 


12.2 reflect.Type 和 reflect.Value 


反射 功能 由 reflect 包 提供 ， 它 定义 了 两 个 重要 的 类 型 : Type 和 value。Type 表示 Go 语 
言 的 一 个 类 型 ， 它 是 一 个 有 很 多 方法 的 接口 ， 这 些 方法 可 以 用 来 识别 类 型 以 及 透视 类 型 的 组 
成 部 分 ， 比 如 一 个 结构 的 各 个 字段 或 者 一 个 函数 的 各 个 参数 。reflect.Type 接口 只 有 一 个 实 
现 ， 即 类 型 描述 符 ( 见 7.5 节 )， 接 口 值 中 的 动态 类 型 也 是 类 型 描述 符 。 

reflect.Typeof 函数 接受 任何 的 interface{} 参数 ， 并 且 把 接口 中 的 动态 类 型 以 reflect. 
Type 形式 返回 。 : 


t := reflect.TypeOf(3) // 一 个 reflect.Type 
fmt.Println(t.String()) // "int" 
fmt.Println(t) A/ “ne 


上 面 的 Typeof(3) 调用 把 数值 3 赋 给 interface{} 参数 。 回 想 一 下 7.5 节 的 内 容 ， 把 一 个 
具体 值 赋 给 一 个 接口 类 型 时 会 发 生 一 个 隐 式 类 型 转换 ， 转 换 会 生成 一 个 包含 两 部 分 内 容 的 接 
口 值 ; 动态 类 型 部 分 是 操作 数 的 类 型 (int),， 动态 值 部 分 是 操作 数 的 值 (3 )。 

因为 reflect.Typeof 返回 一 个 接口 值 对 应 的 动态 类 型 ， 所 以 它 返回 总 是 具体 类 型 (而 不 
是 接口 类 型 )。 比 如 下 面 的 代码 输出 的 是 "*os.File" 而 不 是 "io.writer"。 后 面 我 们 会 看 到 如 
何 让 reflect.Type 也 表示 一 个 接口 类 型 。 


var W io.Writer = os.Stdout 
fmt.Println(reflect.TypeOf(w)) // "*os.File" 


注意 ，reflect.Type 满足 fmt.stringer。 因 为 输出 一 个 接口 值 的 动态 类 型 在 调试 和 日 志 
中 很 常用 ， 所 以 fmt.Printf 提供 了 一 个 简写 方式 %T， 内 部 实现 就 使 用 了 reflect .Typeof: 


fmt .Printf("%TNn"，3) // "int" 


reflect 包 的 另 一 个 重要 类 型 就 是 Value。reflect.value 可 以 包含 一 个 任意 类 型 的 值 。 

reflect.Valueof 困 数 接受 任意 的 interface{} 并 将 接口 的 动态 值 以 reflect.value 的 形式 
返回 。 与 reflect.Typeof 类 似 ，reflect.valueof 的 返回 值 也 都 是 具体 值 ， 不 过 reflect.Value 
也 可 以 包含 一 个 接口 值 。 


v := reflect.Value0f(3) // 一 个 reflect.Value 
fmt.Println(v) 3 
fmt.Printf("%v\n", v) // "3" 
fmt.Println(v.String()) // 注意 : "<int Value>" 
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另 一 个 与 reflect.Type 类 似 的 是 ，reflect.Value 也 满足 fmt.stringer， 但 除非 value 包 
含 的 是 一 个 字符 串 ， 否 则 string 方 法 的 结果 仅仅 暴露 了 类 型 。 通 常 ， 你 需要 使 用 fmt 包 
的 %v 功能 ， 它 对 reflect.Vvalue 会 进行 特殊 处 理 。 

调用 value 的 Type 方法 会 把 它 的 类 型 以 reflect.Type 方式 返回 : 


t := v.Type() // 一 个 reflect.Type 
fmt.println(t.String()) // "int" 


reflect.Valueof 的 道 操作 是 reflect.Value.Interface 方法。 它 返 回 一 个 interface{} 接 
口 值 ， 与 reflect.Value 包含 同一 个 具体 值 。 


Vv := reflect.ValueOf(3) // a reflect.Value 
x := Vv.Interface() // an interface{} 
1 sx (int) // an int 


fmt.Printf("%d\n", i) // "3" 


reflect.Value 和 interface{} 都 可 以 包含 任意 的 值 。 二 者 的 区 别 是 空 接 口 (interface{}) 
隐藏 了 值 的 布局 信息 、 内 置 操作 和 相关 方法 ， 所 以 除非 我 们 知道 它 的 动态 类 型 ， 并 用 一 个 
类 型 断言 来 渗透 进去 (上面 的 代码 就 用 了 类 型 断言 )， 否 则 我 们 对 所 包含 值 能 做 的 事情 很 少 。 
作为 对 比 ，value 有 很 多 方法 可 以 用 来 分 析 所 包含 的 值 ， 而 不 用 知道 它 的 类 型 。 使 用 这 些 技 
术 ， 我 们 可 以 第 二 次 尝试 写 一 个 通用 的 格式 化 函数 ， 它 称 为 format.Any。 

不 用 类 型 分 支 ， 我 们 用 reflect.value 的 kind 方 法 来 区 分 不 同 的 类 型 。 尽 管 有 无 限 种 类 
型 ， 但 类 型 的 分 类 (kind) 只 有 少数 几 种 : 基础 类 型 Boo01、string 以 及 各 种 数字 类 型 ;聚合 
.类 型 Array 和 struct ; 引用 类 型 chan、Func、Ptr、Slice 和 Map、 接 口 类 型 Interface ; 最 后 
还 有 Invalid 类 型 ,表示 它们 还 没有 任何 值 。(reflect.value 的 零 值 就 属于 Invalid 类 型 。) 


8opl.io/ch12/format 





package format 


import ( 
"reflect" 
"strconv" 
) 


// Any 把 任何 值 格式 化 为 一 个 字符 串 
func Any(value interface{}) string { 
return formatAtom(reflect.ValueOf(value)) 


} 


// formatAtom 格式 化 一 个 值 ， 且 不 分 析 它 的 内 部 结构 
func formatAtom(v reflect.Value) string { 
switch v.Kind() { 
case reflect.Invalid: 
return "invalid" 
case reflect.Int, reflect.Int8, reflect.Int16, 
reflect.Int32, reflect.Int64: 
return strconv.FormatInt(v.Int()，16) 
case reflect.Uint, reflect.Uint8, reflect.Uint16, 
reflect.Uint32, reflect.Uint64, reflect.Uintptr: 
return strconv.FormatUint(v.Uint()，16) 
// .…. 为 简化 起 见 ， 省 略 了 浮 点 数 和 复数 的 分 支 ... 
case reflect.Bool : 
return strconv.FormatBool(v.Bool()) 
case reflect.String: 
return strconv.Quote(v.String()) 
case reflect.Chan, reflect.Func, reflect.Ptr, reflect.Slice, reflect.Map: 
return v.Type().String() + " @x" + 
strconv.FormatUint(uint64(v.Pointer()), 16) 
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default: // reflect.Array, reflect.Struct, reflect.Interface 
return v.Type().Sstring() + " value" 
} 
} 

到 现在 为 止 , 该 函数 把 每 个 值 当 做 一 个 没有 内 部 结构 且 不 可 分 割 的 物体 (所 以 才 叫 
formatAtom) 。 对 于 聚合 类 型 (结构 体 和 数组 ) 以 及 接口 ， 它 只 输出 了 值 的 类 型 ; 对 于 引用 类 
型 (通道 、 函 数 、 指 针 、slice 和 map)， 它 输出 了 类 型 和 以 十 六 进 制 表 示 的 引用 地 址 。 这 个 
结果 仍然 不 够 理想 ， 但 确实 是 一 个 很 大 的 进步 。 因 为 kind 只 关心 底层 实现 ， 所 以 format.Any 
对 命名 类 型 的 效果 也 很 好 。 比 如 : 


var x int64 = 1 
var d time.Duration = 1 * time.Nanosecond 


fmt.Println(format.Any(x)) “下 
fmt.Println(format.Any(d)) 1 
fmt.Println(format.Any([]int64{x})) // "[]int64 96x8262b87b6” 


fmt.Println(format.Any([]time.Duration{d})) // "[]time.Duration 6x8262b87e6" 


12.3 Display: 一 个 递归 的 值 显 示 器 


接 下 来 我 们 看 一 下 如 何 改善 组 合 类 型 的 显示 。 这 次 ， 我 们 不 再 实现 一 个 fmt.sprint， 而 
是 实现 一 个 称 为 Display 的 调试 工具 函数 ， 这 个 函数 对 给 定 的 任意 一 个 复杂 值 x， 输 出 这 个 
复杂 值 的 完整 结构 ， 并 对 找到 的 每 个 元 素 标 上 这 个 元 素 的 路 径 。 下 面 先 看 一 个 例子 。 

e, _ := eval.Parse("sqrt(A / pi)") 

Display("e", e) 

在 上 面 的 调用 中 ，Display 的 参数 是 一 个 从 表达 式 求 值 器 生成 的 语法 树 (参考 7.9 节 )。 
Display 的 输出 如 下 所 示 : 


Display e (eval.call): 

e.fn = "sqrt" 

e.args[8] .type = eval.binary 
e.args[8].value.op = 47 
e.args[6].value.x.type = eval.Var 
e.args[8].value.x.value = "A" 
e.args[8].value.y.type = eval.Var 
e.args[6].value.y.value = "pi" 


我 们 应 当 尽 可 能 避免 在 包 的 API 里 边 暴 露 反 射 相 关 的 内 容 。 我 们 将 定义 一 个 未 导出 的 函 
数 display 来 做 真正 的 递归 处 理 ， 再 暴露 Display， 而 Display 则 只 是 一 个 简单 的 封装 ， 并 且 
接受 一 个 interface{} 参数 : 
gopl.io/ch12/display 
func Display(name string, x interface{}) { 


fmt.Printf("Display %s (%T):\n", name, x) 
display(name, reflect.ValueOf(x)) 


在 display 中 ,我 们 使 用 之 前 定义 的 formatAtom 函数 来 输出 基础 值 (基础 类 型 、 函 数 和 
通道 )， 使 用 reflect.value 的 一 些 方法 来 递归 展示 复杂 类 型 的 每 个 组 成 部 分 。 当 递归 深入 
时 ，path 字符 串 (之 前 用 来 表示 起 始 值 ， 比 如 "e") 会 增长 ， 以 表示 如 何 找到 当前 值 (比如 


"eargs[6].value" )。 
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因为 我 们 不 用 再 假装 正在 实现 fmt.sprint， 所 以 接 下 来 我 们 将 使 用 fmt 包 来 简化 该 示例 : 


func display(path string, v reflect.Value) { 
switch v.Kind() { 
case reflect.Invalid: 
fmt.Printf("%s = invalid\n", path) 
case reflect.Slice, reflect.Array: 
for i := 6; i < Vv.Len(); i++ { 
display(fmt.Sprintf("%s[%d]", path, i), v.Index(i)) 


case reflect.Struct: 
for i := 6; i < Vv.NumField(); i++ { 
fieldPath := fmt.Sprintf("%s.%s", path, v.Type().Field(i).Name) 
display(fieldPath，v.Field(i)) 


case reflect.Map: 
for _, key := range v.MapKeys() { 
display(fmt.Sprintf("%s[%s]", path, 
formatAtom(key)), v.MapIndex(key)) 


case reflect.Ptr: 
if v.IsSNil() { 
fmt.Printf("%s = nil\n", path) 
} else { 
display(fmt.Sprintf("(*%s)", path), v.Elem()) 


case reflect.Interface: 
if v.IsNil() { 
fmt.Printf("%s = nil\n", path) 
} else { 
fmt.Printf("%s.type = %s\n", path, v.Elem().Type()) 
display(path+" .value", v.Elem()) 


} 
default: // 基本 类 型 、 通 道 、 函 数 
fmt .Printf("%s = %s\n", path, formatAtom(v)) 


} 
} 


接 下 来 将 对 这 些 分 支 逐 一 讲解 。 

slice 与 数组 : 两 者 的 逻辑 一 致 。Len 方法 会 返回 slice 或 者 数组 中 元 素 的 个 数 ，Index(i) 
会 返回 第 i 个 元 素 ， 返回 的 元 素 类 型 为 reflect.value (如 果 i 越界 会 月 泪 )。 这 两 个 方法 与 
内 置 的 len(a) 和 a[i] 序列 操作 类 似 。 在 每 个 序列 元 素 上 递归 调用 了 display 函数 ， 只 是 在 路 
径 后 边 加 上 了 "[i]"。 

尽管 reflect.value 有 很 多 方法 ， 但 对 于 每 个 值 ， 只 有 少量 的 方法 可 以 安全 调用 。 比 如 ， 
Index 方法 可 以 在 Slice、Array、String 类 型 的 值 上 安全 调用 ， 但 对 于 其 他 类 型 则 会 月 省 。 

结构 体 : NumField 方法 可 以 报告 结果 中 的 字段 数 ，Field(i) 会 返回 第 i 个 字段 ， 返回 的 
字段 类 型 为 reflect.value。 字 段 列 表 包括 了 从 匿名 字段 中 做 了 类 型 提升 的 字段 。 要 追加 一 个 
类 似 ".f" 的 字段 选择 标记 到 路 径 中 ， 我 们 必须 先 获得 结构 体 的 reflect.Type 才能 获 到 第 i 个 
字段 的 名 称 。 

map : Mapkeys 方 法 返回 一 个 元 素 类 型 为 reflect.value 的 slice， 每 个 元 素 都 是 一 个 
map 的 键 。 与 平常 遍历 map 的 结果 类 似 ， 顺 序 是 不 固定 的 。MapIndex(key) 返回 key 对 应 的 
值 。 我 们 追加 下 标记 号 "[key]" 到 路 径 中 。( 此 处 忽略 了 一 些 情形 。map 的 键 类 型 有 可 能 超出 
formatAtom 能 处 理 好 的 类 型 ， 比 如 数组 、 结 构 体 、 接 口 都 可 以 是 合法 的 字典 键 。 在 练习 12.1 
中 会 有 输出 完整 键 的 内 容 。) 
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指针 : Elen 方 法 返回 指针 指向 的 变量 ， 同 样 也 是 以 reflect.value 类 型 返回 。 这 个 方法 
在 指针 是 nil 时 也 能 正确 处 理 ， 但 返回 的 结果 属于 Invalid 类 型 ， 所 以 我 们 用 IsNil 来 显 式 
检测 空 指针 ， 方 便 输出 一 条 更 合适 的 消息 。 为 了 避免 二 义 性 ， 在 路 径 前 加 了 一 个 "*"， 外 边 
再 加 上 一 对 圆 括号 。 

接口 : 我 们 再 次 使 用 IsNil 来 判断 接口 是 否 为 空 ， 如 果 非 空 ， 我 们 通过 v.Elem() 来 获取 
动态 值 ， 进 一 步 输出 它 的 类 型 和 值 。 

既然 Display 函数 完成 了 ， 接 下 来 我 们 就 实际 使 用 一 下 。 下 面 的 Movie 类 型 引 自 4.5 节 ， 
但 略 有 修改 : 


type Movie struct { 
Title, Subtitle string 


Year int 

Color bool 

Actor map[string]string 
Oscars []string 

Sequel *string 


下 面 声明 这 个 类 型 的 一 个 值 ， 并 查看 Display 如 何 处 理 这 个 值 : 


strangelove := Movief{ 


Title: "Dr. Strangelove", 

Subtitle: "How I Learned to Stop Worrying and Love the Bomb", 

Year: 1964， 

Color: false, 

Actor: map[string]string{ 
"Dr. Strangelove": "Peter Sellers", 
"Grp. Capt. Lionel Mandrake": "Peter Sellers", 
"Pres. Merkin Muffley": "Peter Sellers", 
"Gen. Buck Turgidson": "George C. Scott", 
"Brig. Gen. Jack D. Ripper": "Sterling Hayden", 
Maj. T.J]. "King" Kong: "Slim Pickens", 

}, 


Oscars: []string{ 
"Best Actor (Nomin.)", 
"Best Adapted Screenplay (Nomin.)", 
"Best Director (Nomin.)", 
"Best Picture (Nomin.)", 
}, 
} 


调用 Display("strangelove"，strangelove) 会 输出 : 


Display strangelove (display.Movie): 

strangelove.Title = "Dr. Strangelove" 

strangelove.Subtitle = "How I Learned to Stop Worrying and Love the Bomb" 
strangelove.Year = 1964 

strangelove.Color = false 

strangelove.Actor["Gen. Buck Turgidson"] = "George C. Scott" 
strangelove.Actor["Brig. Gen. Jack D. Ripper"] = "Sterling Hayden" 
strangelove.Actor["Maj. T.]. \"King\" Kong"] = "Slim Pickens" 
strangelove.Actor["Dr. Strangelove"] = "Peter Sellers" 
strangelove.Actor["Grp. Capt. Lionel Mandrake"] = "Peter Sellers" 
strangelove.Actor["Pres. Merkin Muffley"] = "Peter Sellers" 


strangelove.0scars[6] = "Best Actor (Nomin.)" 
strangelove.0scars[1] = "Best Adapted Screenplay (Nomin.)" 
strangelove.0scars[2] = "Best Director (Nomin.)" 
strangelove.Oscars[3] = "Best Picture (Nomin.)" 


strangelove.Sequel = nil 
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我 们 可 以 使 用 Display 来 显示 标准 库 类 型 的 内 部 结构 ， 比 如 *os.File: 


Display("os.Stderr", os.Stderr) 

// 输出 : 

// 显示 os.Stderr (*os.File): 

// (*(*os.Stderr).file).fd = 2 

// (*(*os.Stderr).file).name = "/dev/stderr" 
// (*(*os.Stderr).file).nepipe = 6 


注意 ， 即 使 非 导 出 字段 在 反射 下 也 是 可 见 的 。 当 然 ， 这 个 例子 的 输出 在 各 个 平台 上 可 能 
会 有 差异 ， 也 可 能 随 着 库 的 演进 而 改变 。( 毕竟 把 字段 设 为 私有 是 由 原因 的 ! ) 

我 们 还 可 以 把 Display 作用 在 reflect.value 上 ,并 且 观 察 它 如 何 遍 历 *os.File 的 类 型 
描述 符 的 内 部 结构 。 调 用 Display("rv",reflect.valueof(os.Sstderr)) 的 输出 如 下 所 示 ， 当 然 ， 
每 人 得 到 的 结果 可 能 会 有 不 同 : 


Display rvV (reflect.Value): 

(*rV.typ).size = 8 

(*rV.typ).hash = 871669668 

(*rV.typ).align = 8 

(*rV.typ).fieldAlign = 8 

(*rV.typ).kind = 22 

(*(*rV.typ).string) = "*0s.File" 

(*(*(*rV.typ).uncommonType).methods[8].name) = "Chdir" 
(*(*(*(*rV.typ).uncommonType).methods[8] .mtyp).string) = "func() error" 
(*(*(*(*rV.typ).uncommonType).methods[8] .typ).string) = "func(*os.File) error" 


注意 如 下 两 个 例子 的 差异 : 
var i interface{} = 3 


Display("i", i) 

// 输出 : 

// 显示 i (int): 

//i=3 

Display("&i", &i) 

// 输出 : 

// 显示 &i (*interface {}): 
/{ (*8i).type = int 

// (*&i).value = 3 


在 第 一 个 例子 中 ，Display 调用 reflect.valueof(i)， 返回 值 的 类 型 为 Int。 正 如 12.2 节 
提 到 的 ， 因 为 reflect.valueof 从 接口 值 中 提取 值 部 分 ， 所 以 它 永 远 返 回 一 个 具体 类 型 的 
Value。 

在 第 二 个 例子 中 ，pisplay 调用 reflect.valueof(&i)， 其 返回 值 的 类 型 为 ptr， 并 且 是 一 
个 指向 i 的 指针 。 在 Display 函数 的 Ptr 分 支 中 ,会 调用 这 个 值 的 Elen 方 法， 返回 一 个 代表 
变量 i 的 Value， 其 类 型 为 Interface。 类 似 这 种 间接 获得 的 value 可 以 代表 任何 值 ， 包 括 接 
口 。 这 时 display 函数 递归 调用 自己 ， 输 出 接口 的 动态 类 型 和 动态 值 。 

在 当前 的 实现 中 ，pisplay 在 对 象 图 中 存在 循环 引用 时 不 会 自行 终止 ， 比 如 处 理 一 个 首 
尾 相 接 的 链表 时 : 


// 一 个 指向 自己 的 结构 体 

type Cycle struct{ Value int; Tail *Cycle } 
var c Cycle 

Cc = Cycle{42, &c} 

Display("c", c) 
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Display 输出 了 一 个 持续 增长 的 展开 式 : 


Display c¢ (display.Cycle): 

c.Value = 42 

(*c.Tail).Value = 42 
(*(*c.Tail).Tail).Value = 42 
(*(*(*c.Tail).Tail).Tail).Value = 42 


很 多 Go 程序 都 至 少 包含 一 些 循环 引用 的 数据 。 让 Display 能 鲁 棒 地 处 理 这 些 循环 引用 
要 一 些小 技巧 ， 需 要 记录 所 有 曾经 被 访问 过 的 引用 ， 当 然 成 本 也 不 低 。 一 个 通用 的 解决 方案 
需要 unsafe 语言 特性 ，13.3 节 将 介绍 这 个 特性 。 

循环 引用 在 fmt.sprinf 中 不 构成 一 个 大 问题 ， 因 为 它 很 少 尝试 输出 整个 结构 体 。 比 如 ， 
当 它 遇 到 一 个 指针 时 ， 它 会 输出 指针 的 数字 值 ， 这 样 就 打破 了 循环 引用 。 但 如 果 遇 到 一 个 
slice 或 者 map 包含 自身 ， 它 还 是 会 卡 住 ， 只 是 不 值得 为 了 这 种 罕见 的 案例 而 去 承担 处 理 循 
环 引 用 的 成 本 。 

练习 12.1: 扩展 pisplay， 让 它 可 以 处 理 map 中 键 为 结构 体 或 者 数组 的 情形 。 

练习 12.2: 通过 限制 递归 的 层 数 ， 让 pisplay 能 安全 处 理 循环 引用 的 数据 结构 。( 在 
13.3 节 中 ， 我 们 可 以 看 到 另外 一 个 检测 循环 引用 的 方法 。) 


12.4 示例: 编码 S 表达 式 


Display 是 一 个 用 于 显示 数据 结构 的 调试 例 程 ， 但 是 只 要 对 它 稍 加 修改 ， 就 可 以 用 它 来 
对 任意 Go 对 象 进行 编码 或 编排 ， 使 之 成 为 适用 于 进程 间 通 信 的 可 移植 记 法 中 的 消息 。 

正如 我 们 在 4.5 节 见 到 的 ，Go 的 标准 库 支 持 各 种 格式 ， 包 括 JSON、XML 和 ASN.1。 
另 一 种 广泛 使 用 的 格式 是 Lisp 语言 中 的 S 表达 式 。 与 其 他 格式 不 同 的 是 ，S 表达 式 还 没 被 
Go 标准 库 支 持 ， 这 是 因为 尽管 有 几 次 标准 化 的 尝试 并 存在 很 多 实现 ， 但 它们 仍然 没有 被 广 
泛 接受 的 严格 定义 。 

在 本 节 中 ， 我 们 会 定义 一 个 包 ， 它 使 用 $ 表达 式 来 编码 任意 的 Go 对 象 ， 这 个 S 表达 式 
需要 支持 下 面 的 表达 式 : 


42 integer 


"hello" string ( 转 义 方法 与 Go 一 致 ) 
foo symbol (直接 使 用 名 字 ， 不 加 引号 ) 
(1 2 3) list (用 括号 括 起 来 的 零 个 及 以 上 元 素 ) 


布尔 值 一 般 用 符号 t 表 示 真 ， 用 空 列 表 () 或 者 符号 nil 表示 假 ， 但 为 了 简化 起 见 ， 这 
个 实现 直接 忽略 布尔 值 。 通 道 和 函数 也 被 忽略 了 ， 因 为 它们 的 状态 对 于 反射 来 说 是 不 透明 
的 。 这 个 实现 还 忽略 了 实数 、 复 数 和 接口 ， 在 练习 12.3 中 我 们 会 加 上 这 些 支 持 。 

我 们 将 按 如 下 思路 来 把 Go 语言 的 值 编码 为 $ 表达 式 。 整 数 和 字符 串 的 编码 方式 是 显 而 
易 见 的 。 空 值 直接 编码 为 符号 nil， 数 组 和 slice 则 用 列表 记 法 来 编码 。 

结构 被 编码 为 一 个 关于 字段 绑 定 ( field binding) 的 列表 ， 每 个 字段 绑 定 都 是 一 个 两 个 元 
素 的 列表 ， 其 中 第 一 个 元 素 (使 用 符号 ) 是 字段 名 ， 第 二 个 元 素 是 字段 值 。map 也 编码 为 元 
素 对 的 列表 ， 每 个 元 素 对 都 是 map 中 一 项 的 键 和 值 。 按 照 传统 ，S 表达 式 使 用 形式 为 (key . 
value) 的 单个 构造 单元 ( cons cell) 来 表示 键 值 对 ， 而 不 是 用 双 元 素 的 列表 ， 但 为 了 简化 解 
码 过 程 ， 我 们 将 忽略 带 “.” 的 列表 表示 法 。 

编码 用 如 下 的 单个 递归 调用 函数 encode 来 实现 。 它 的 结构 与 上 一 节 的 Display 在 本 质 上 
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是 一 致 的 : 


Bopl1.io/ch12/sexpr 
~ func encode(buf *bytes.Buffer, v reflect.Value) error { 
switch v.Kind() { 
case reflect.TInvalid: 
buf .Writestring("nil") 


case reflect.Int, reflect.Int8, reflect.Int16, 
reflect.Int32, reflect.Int64: 
fmt.Fprintf(buf, "%d", v.Int()) 


case reflect.Uint, reflect.Uint8, reflect.Uint16, 
reflect.Uint32, reflect.Uint64, reflect.Uintptr: 
fmt.Fprintf(buf, "%d", v.Uint()) 


case reflect.String: 
fmt.Fprintf(buf, "%q", v.String()) 


case reflect.Ptr: 
return encode(buf, v.Elem()) 


case reflect.Array，reflect.Slice: // (value ...) 
buf.WriteByte('(') 
for i := 0; i < v.Len(); i++ { 
Pi 
buf.WriteByte(' ') 
} 
if err := encode(buf, v.Index(i)); err != nil { 
return err 
} 


} 
buf .WriteByte(')') 


case reflect.Struct: // ((name value) ...) 
buf.WriteByte('(') 
for :=6jiv.NumField(); i++ { 
ifi>e6et 
buf.WriteByte(' ') 
} 
fmt.Fprintf(buf, "(%s ", v.Type().Field(i).Name) 
if err := encode(buf, v.Field(i)); err != nil { 
return err 
} 
buf.WriteByte(')') 


} 
buf.WriteByte(')') 


case reflect.Map: // ((key value) ...) 
buf .WriteByte('(') 
for i, key := range v.MapKeys() { 
ifi>6t 
buf.WriteByte(' ') 


} 

buf .WriteByte('(') 

if err := encode(buf, key); err != nil { 
return err 

} 


buf .WriteByte(' ') 
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if err := encode(buf, v.MapIndex(key)); err != nil { 
return err 
} 
buf .WriteByte(')') 
buf .WriteByte(')') 


default: // float, complex, bool, chan, func, interface 
return fmt.Errorf("unsupported type: %s", v.Type()) 

} 

return nil 


} 


Marshal 函数 把 上 面 的 编码 器 封装 成 一 个 API， 它 类 似 于 其 他 encoding/… 包 里 的 API: 


// Marshal 把 Go 的 值 编码 为 S 表达 式 的 形式 
func Marshal(v interface{}) ([]byte, error) { 
var buf bytes.Buffer 
if err := encode(&buf, reflect.ValueOf(v)); err != nil { 
return nil, err 
} 
return buf.Bytes(), nil 
} 


下 面 是 12.3 节 的 strangelove 应 用 Marshal 后 的 输出 : 


((Title "Dr. Strangelove") (Subtitle "How I Learned to Stop Worrying and Lo 
ve the Bomb") (Year 1964) (Actor (("Grp. Capt. Lionel Mandrake" "Peter Sell 
ers") ("Pres. Merkin Muffley" "Peter Sellers") ("Gen. Buck Turgidson" "Geor 
ge C. Scott") ("Brig. Gen. Jack D. Ripper” "Sterling Hayden") ("Maj. T.J. \ 
"King\" Kong" "Slim Pickens") ("Dr. Strangelove" "Peter Sellers"))) (0scars 
("Best Actor (Nomin.)" "Best Adapted Screenplay (Nomin.)" "Best Director (CN 
omin.)" "Best Picture (Nomin.)")) (Sequel nil)) 


整个 输出 都 在 一 行 且 使 用 了 最 少 的 空格 数 ， 导 致 读 起 来 很 困难 。 根 据 S 表达 式 的 习惯 手 
动 格式 化 后 的 结果 如 下 所 示 。 把 编写 S 表达 式 的 美化 打印 器 留 作 练习 〈 有 点 挑战 )， 从 gopl.io 
上 可 以 下 载 一 个 简单 的 版 本 。 


((Title "Dr. Strangelove") 

(Subtitle "How I Learned to Stop Worrying and Love the Bomb") 

(Year 1964) 

(Actor (("Grp. Capt. Lionel Mandrake" "Peter Sellers") 
("Pres. Merkin Muffley" "Peter Sellers") 
("Gen. Buck Turgidson" "George C. Scott") 
("Brig. Gen. Jack D. Ripper" "Sterling Hayden") 
("Maj. T.]. \"King\" Kong" "Slim Pickens") 
("Dr. Strangelove" "Peter Sellers"))) 

(Oscars ("Best Actor (Nomin.)" 
"Best Adapted Screenplay (Nomin.)" 
"Best Director (Nomin.)" 
"Best Picture (Nomin.)")) 

(Sequel nil)) 


与 fmt.Print、json.Marshal、Display 这 些 函 数 类 似 ，sexpr.Marshal 在 遇 到 循环 应 用 的 数 
据 时 也 会 无 限 循环 。 

12.6 节 会 概述 S 表达 式 解 码 函 数 的 实现 ， 但 在 那 之 前 ， 我 们 需要 先 了 解 一 下 如 何 用 反射 
来 更 新 程序 中 的 变量 。 

练习 12.3 : 实现 encode 函数 缺失 的 功能 。 把 布尔 值 编码 为 +t 和 nil， 浮 点 数 则 用 Go 语 
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言 的 表示 法 ， 像 1+2i 这 种 复数 则 编码 为 #c(1.8。 2.6)。 接 口 编码 为 成 对 的 类 型 名 和 值 ， 比 如 
("[]int"(1 2 3))， 但 要 注意 这 个 方法 是 有 二 义 性 的 ， 因 为 reflect.Type.string 方法 可 能 会 
对 不 同 的 类 型 生成 同样 的 字符 串 。 

练习 12.4: 修改 encode 函数 ， 输 出 如 上 所 示 的 美化 后 的 $ 表达 式 。 

练习 12.5: 改写 encode 函数 ， 从 输出 S 表达 式 改 为 输出 JSON。 使 用 标准 库 的 解码 器 
json.Unmarshal 来 测试 编码 器 。 

练习 12.6: 改写 encode 函数 ， 优 化 输出 ， 如 果 字 段 值 是 其 类 型 的 零 值 则 不 须 编码 。 

练习 12.7: 参考 json.encoder (参见 4.5 节 ) 的 风格 ,创建 一 个 S 表达 式 编 码 器 的 流 式 API。 


12.5 使 用 reflect.Value 来 设置 值 


到 现在 为 止 ， 在 程序 中 反射 还 只 用 来 解析 变量 值 。 而 本 节 的 重点 则 是 如 何 改 变 值 。 

回想 一 下 Go 语言 的 表达 式 ， 比 如 x、x.f[1] 、*p 这 样 的 表达 式 表示 一 个 变量 ， 而 x+1、 
f(2) 之 类 的 表达 式 则 不 表示 变量 。 一 个 变量 是 一 个 可 寻 址 的 存储 区 域 ， 其 中 包含 了 一 个 值 ， 
并 且 它 的 值 可 以 通过 这 个 地 址 来 更 新 。 

对 reflect.Value 也 有 一 个 类 似 的 区 分 ， 某 些 是 可 寻 址 的 ， 而 其 他 的 并 非 如 此 。 比 如 如 
下 的 变量 声明 : 


x := 2 // 值 类 型 变量 ? 

a := reflect.ValueOf(2) /2 int no 

b := reflect.ValueOf(x) 对 沁 int no 

Cc := reflect.ValueOf(&x) // &x *int no 

d := c.Elem() yA int yes (x) 


a 里 边 的 值 是 不 可 寻 址 的 ， 它 包含 的 仅仅 是 整数 2 的 一 个 副本 。b 也 是 如 此 。c 里 边 的 值 
也 是 不 可 寻 址 的 ， 它 包含 的 是 指针 ax 的 一 个 副本 。 事 实 上 ， 通 过 reflect.valueof(x) 返回 的 
reflect.Value 都 是 不 可 寻 址 的 。 但 d 是 通过 对 < 中 的 指针 提 领 得 来 的 ， 所 以 它 是 可 寻 址 的 。 
可 以 通过 这 个 方法 ， 调 用 reflect.valueof(&x) .Elem() 来 获得 任意 变量 x 可 寻 址 的 value 值 。 
可 以 通过 变量 的 canAddr 方法 来 询问 reflect.value 变量 是 否 可 寻 址 : 


fmt.Println(a.CanAddr()) // "false" 
fmt.Println(b.CanAddr()) // "false" 
fmt.Println(c.CanAddr()) // "false" 
fmt.Println(d.CanAddr()) // "true" 


我 们 可 以 通过 一 个 指针 来 间接 获取 一 个 可 寻 址 的 reflect.value， 即 使 这 个 指针 是 不 可 
寻 址 的 。 可 寻 址 的 常见 规则 都 在 反射 包 里 边 有 对 应 项 。 比 如 ，slice 的 脚 标 表 达 式 e[i] 隐 
式 地 做 了 指针 去 引用 ， 所 以 即使 。 是 不 可 寻 址 的 ， 这 个 表达 式 仍 然 是 可 寻 址 的 。 类 似 地 ， 
reflect.Value0f(e) .Index(i) 代表 一 个 变量 ， 尽 管 reflect.valueof(e) 不 是 可 寻 址 的 ， 这 个 变 
量 也 是 可 寻 址 的 。 

从 一 个 可 寻 址 的 reflect.value() 获取 变量 需要 三 步 。 首 先 ， 调 用 Addr()， 返 回 一 个 
value， 其 中 包含 一 个 指向 变量 的 指针 ， 接 下 来 ， 在 这 个 value 上 调用 Interface()， 会 返回 
一 个 包含 这 个 指针 的 interfacef} 值 。 最 后 ， 如 果 我 们 知道 变量 的 类 型 ， 我 们 可 以 使 用 类 型 
断言 来 把 接口 内 容 转 换 为 一 个 普通 指针 。 之 后 就 可 以 通过 这 个 指针 来 更 新 变量 了 : 


x := 2 

d := reflect.ValueOf(&x).Elem() // d 代表 变量 x 
px := d.Addr().Interface().(*int) // px := &x 
*pX = 马 // XxX=3 
fmt.Println(x) J 
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还 可 以 直接 通过 可 寻 址 的 reflect.value 来 更 新 变量 ,不 用 通过 指针 ， 而 是 直接 调用 


reflect.Value.Set 方法 : 


d.Set(reflect.ValueOf(4)) 
fmt.Println(x) // "4" 


平常 由 编译 器 来 检查 的 那些 可 赋值 性 条 件 ， 在 这 种 情况 下 则 是 在 运行 时 由 set 方法 来 检 
查 。 上 面 的 变量 和 值 都 是 int 类 型 ， 但 如 果 变 量 类 型 是 int64， 这 个 程序 就 会 月 溃 。 所 以 确 
保 这 个 值 对 于 变量 类 型 是 可 赋值 的 是 很 重要 的 一 件 事 。 

d.Set(reflect.ValueOf(int64(5))) // 崩溃 : int64 不 可 赋值 给 int 

当然 ， 在 一 个 不 可 寻 址 的 reflect.value 上 调用 set 方法 也 会 朋 溃 : 


pe 2 
b reflect.ValueOf(x) 
b.Set(reflect.Value0f(3)) // 骨 溃 : 在 不 可 寻 址 的 值 上 使 用 Set 


我 们 还 有 为 一 些 基 本 类 型 特 化 的 set 变种 : setInt、sSetUint 、setstring 、SsetFloat 等 : 

d := reflect.ValueOf(&x).Elem() 

d.SetInt(3) 

fmt.Println(x) // "3" 

这 些 方 法 还 有 一 定 程 度 的 容错 性 。 只 要 变量 类 型 是 某 种 带 符号 的 整数 ， 比 如 setInt， 其 
至 可 以 是 底层 类 型 为 带 符号 整数 的 命名 类 型 ， 都 可 以 成 功 。 如 果 值 太 大 了 还 会 无 提示 地 截断 
它 。 但 需要 注意 的 是 ， 在 指向 interface{} 变量 的 reflect.value 上 调用 setInt 会 奔 溃 (尽管 
使 用 set 就 没有 问题 )。 


x := 1 

rx := reflect.ValueOf(&x).Elem() 

rx.SetInt(2) // OKs x = 2 
rx.Set(reflect.ValueOf(3)) /六 四 Ko 二 二 和 

rx.setstring("hello") // 崩溃 : 字符 串 不 能 赋 给 整数 
rx.Set(reflect.Value0Of("hello")) // 崩溃 : 字符 串 不 能 赋 给 整数 

var y interface{} 

ry := reflect.ValueOf(&y).Elem() 

ry.SetInt(2) // 崩溃 : 在 指向 接口 的 Value 上 调用 SetInt 
ry.Set(reflect.ValueOf(3)) // OK, y = int(3) 

ry.Setstring("hello") // 崩溃 : 在 指向 接口 的 Value 上 调用 Setstring 


Pry.Set(reflect.ValueOf("hello")) // OK, y = "hello" 


在 把 Display 作用 于 os.stdout 时 ， 我 们 发 现 反射 可 以 读 取 到 未 导出 结构 字段 的 值 ， 通 
过 Go 语言 的 常规 方法 这 些 值 是 无 法 读 取 的 。 比 如 os.File 结构 在 类 UNIX 平台 上 的 fd int 
字段 。 但 反射 不 能 更 新 这 些 值 : 


stdout := reflect.ValueOf(os.Stdout).Elem() // *os.Stdout， 一 个 os.File 变量 

fmt.Println(stdout.Type()) A “osFile" 

fd := stdout.FieldByName("fd") 

fmt.Println(fd.Int()) // "1" 

fd.SetInt(2) // 崩溃 : 未 导出 字段 

一 个 可 寻 址 的 reflect.value 会 记录 它 是 否 是 通过 遍历 一 个 未 导出 字段 来 获得 的 ， 如 果 
是 这 样 ， 则 不 允许 修改 。 所 以 ， 在 更 新 变量 前 用 canaddr 来 检查 并 不 能 保证 正确 。canset 方 


法 才能 正确 地 报告 一 个 reflect.value 是 否 可 寻 址 且 可 更 改 : 


fmt.Println(fd.CanAddr(), fd.Canset()) // "true false" 
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12.6 示例 : 解码 S 表达 式 

对 于 标准 库 encoding/... 提供 的 每 一 个 Marshal 函数 ， 都 有 一 个 对 应 的 Unmarshal 函数 来 
做 解码 。 正 如 在 4.5 节 中 所 见 到 的 ， 对 于 一 个 包含 编码 的 JSON 数据 的 字 节 slice， 我 们 可 以 
按 下 面 的 方法 解码 为 Movie 类 型 (参见 12.3 节 ): 


data := [J]byte{/* ... */} 
var movie Movie 
err := json.Unmarshal(data, &movie) 


Unmarshal 因数 使 用 反射 来 修改 已 存在 的 movie 变量 的 字段 ， 根 据 Movie 类 型 和 输入 数据 
来 创建 新 的 map 、 结 构 和 slice。 

现在 为 $ 表达 式 实 现 一 个 简单 的 unmarshal 函数 ， 这 个 函数 与 上 面 使 用 过 的 标准 json. 
Unmarshal 困 数 类 似 ， 与 之 前 的 sexpr.Marshal 则 正好 相反 。 我 必须 先 提醒 你 ， 一 个 鲁 棒 且 通 
用 的 实现 需要 的 代码 量 远 超 这 个 示例 能 容纳 的 量 (尽管 这 个 示例 已 经 很 长 了 )， 所 以 我 们 必 
须 走 一 些 捷 径 。 我 们 仅 支 持 了 S 表达 式 一 个 有 限 的 子 集 ， 并 且 没 有 优雅 地 处 理 错 误 。 代 码 的 
目的 是 阐释 反射 ， 而 不 是 语法 分 析 。 

词法 分 析 程 序 使 用 text/scanner 包 提 供 的 扫描 器 scanner 类 型 来 把 输入 流 分 解 成 一 系列 
的 标记 (token)， 包 括 注释 、 标 识 符 、 字 符 串 字面 量 和 数字 字面 量 。 扫 描 器 的 scan 方法 向 
前 推进 扫描 位 置 并 且 返 回 下 一 个 标记 (类 型 为 rune)。 大 部 分 标记 (比如 '(') 都 只 包含 单个 
rune， 但 text/scanner 包 则 用 rune 类 型 的 小 负数 区 域 来 表示 那些 多 字符 的 标记 ， 比 如 Ident、 
string、Int。 调 用 scan 会 返回 标记 的 类 型 ， 调 用 TokenText 则 会 返回 标记 对 应 的 文本 。 

因为 一 个 典型 的 分 析 器 需要 多 次 分 析 当 前 的 标记 ， 但 scan 方法 会 一 直 推 进 扫描 位 置 ， 
所 以 我 们 把 扫描 器 封装 到 一 个 lexer 辅助 类 型 中 ， 其 中 保存 了 scan 最 近 返 回 的 标记 。 


gopl.io/ch12/sexpr 
type lexer struct { 
scan scanner.Scanner 
token rune // 当前 标记 





} 


func (lex *lexer) next() { lex.token = lex.scan.Scan() } 
func (lex *lexer) text() string { return lex.scan.TokenText() } 


func (lex *lexer) consume(want rune) { 
if lex.token != want { // 注意 : 这 不 是 一 个 好 的 错误 处 理 示 例 
panic(fmt.Sprintf("got %q, want %q", lex.text(), want)) 
} s 


lex.next() 
} 
让 我 们 先 看 一 下 分 析 器 。 它 有 两 个 主要 的 函数 ， 第 一 个 是 read， 它 读 取 从 当前 标记 开始 
的 $ 表达 式 ， 并 更 新 由 可 寻 址 的 reflect.value v 指向 的 变量 。 


func read(lex *lexer, v reflect.Value) { 
switch lex.token { 
// 仅 有 的 有 效 标识 符 是 "nil” 和 结构 体 的 字段 名 


// "nil" and struct field names. 


if lex.text() ==. ils A 
v.Set(reflect.Zero(v.Type())) 
lex.next() 
return 
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case scanner.String: 
s，_ := strconv.Unquote(lex.text()) // 注意 : 错误 被 忽略 
v.Setstring(s) 
lex.next() 
return 
case scanner.Int: 
i，_ := strconv.Atoi(lex.text()) // 注意 : 错误 被 忽略 
v.SetInt(int64(i)) 
lex.next() 
return 
case '(': 
lex.next() 
readList(lex, v) 
lex.next() // consume “) 
”Peturn 


} 
panic(fmt.Sprintf("unexpected token %q", lex.text())) 
} 


S 表达 式 为 两 个 不 同 的 目的 使 用 标识 符 : 结构 体 的 字段 名 和 指针 的 nil 值 。read 函数 只 
处 理 后 一 种 情形 。 当 它 遇 到 scanner.Ident "nil" 时 ， 通 过 reflect.zero 函数 把 v 设置 为 其 类 
型 的 零 值 。 对 于 其 他 标识 符 ， 则 产生 一 个 错误 8 。readList 函数 ( 接 下 来 马上 要 看 到 ) 则 把 标 
识 符 处 理 为 结构 字段 名 。 

一 个 “标记 代表 一 个 列表 的 开始 。 第 二 个 函数 readList 可 把 列表 解码 为 多 种 类 型 . 
map 、 结 构 体 、slice 或 者 数组 ， 主 要 根据 当前 正在 处 理 的 Go 变量 类 型 。 对 于 每 种 情形 ， 都 
会 循环 解析 内 容 直 到 过 到 匹配 的 右 插 号 ')'， 这 个 是 由 endList 函数 来 检测 的 。 

比较 有 趣 的 地 方 是 递归 。 最 简单 的 例子 是 一 个 数组 。 在 遇 到 ')' 之 前 ， 我 们 使 用 Index 
方法 来 获得 数组 的 一 个 元 素 ， 再 递归 调用 read 来 填充 数据 。 与 其 他 错误 处 理 类 似 ， 如 果 输 
入 数据 导致 解码 器 的 下 标 超过 了 数组 的 大 小 ， 解 码 器 骨 溃 。slice 的 流程 与 数组 比较 类 似 ， 不 
同 之 处 是 先 创建 每 一 个 元 素 变量 ， 再 填充 ， 最 后 追加 到 slice 中 。 

结构 体 和 map 在 循环 的 每 一 轮 中 都 必须 解析 一 个 关于 (key value) 的 子 列表 。 对 于 结构 
体 ，key 是 用 来 定位 字段 的 符号 。 与 数组 的 情形 类 似 ， 我 们 通过 FieldByName 函数 来 获得 结构 
体 字 段 的 现 有 变量 ， 再 递归 调用 read 来 填充 。 对 于 map，key 可 以 是 任何 类 型 。 与 slice 类 
似 ， 先 创建 新 变量 ， 递 归 地 填充 ， 最 后 再 把 新 的 键 值 对 插 和 人 映射 表 中 。 


func readList(lex *lexer, v reflect.Value) { 
switch v.Kind() { 
case reflect.Array: // (item ...) 
for i := 6j lendList(lex); i++ { 
read(lex, v.Index(i)) 


case reflect.Slice: // (item ...) 
for lendList(lex) { 
item := reflect.New(v.Type().Elem()).Elem() 
read(lex, item) 
Vv.Set(reflect.Append(v, item)) 
} 


日 根据 代码 ， 应 该 是 直接 忽略 了 。 一 一 译 者 注 
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case reflect.Sstruct: // ((name value) ...) 
for lendList(lex) { 
lex.consume('(') 
if lex.token != scanner.Ident { 
panic(fmt.Sprintf("got token %q, want field name", lex.text())) 


} 
name := lex.text() 
lex.next() 


read(lex, v.FieldByName(name)) 
lex.consume(')') 


case reflect.Map: // ((key value) ...) 
v.Set(reflect.MakeMap(v.Type())) 
for lendList(lex) { 
lex.consume('(') 
key := reflect.New(v.Type().Key()).Elem() 
read(lex, key) 
value := reflect.New(v.Type().Elem()).Elem() 
read(lex, value) 
v.SetMapIndex(key, value) 
lex.consume(')') 


} 


default: 
panic(fmt.Sprintf("cannot decode list into %v", v.Type())) 
} 
} 


func endList(lex *lexer) bool { 
switch lex.token { 
case scanner .EOF: 
panic("end of file") 
case ')': 
return true 


return false 


} 


最 后 ， 把 解析 器 封装 成 如 下 所 示 的 一 个 导出 函数 unmarshal， 隐 藏 了 实现 中 很 多 不 完 : 
之 处 。 比 如 在 解析 过 程 中 遇 到 错误 会 崩溃 ， 因 此 unmarshal 使 用 一 个 延迟 调用 来 从 崩溃 中 恢 
复 ( 见 5.10 节 )， 并 且 返 回 一 条 错误 消息 。 


// Unmarshal 解析 S 表达 式 数 据 并 且 填 充 到 非 nil 指针 out 指向 的 变量 
func Unmarshal(data []byte，out interface{}) (err error) { 
lex := &lexer{scan: scanner.Scanner{Mode: scanner.GoTokens}} 
lex.scan.Init(bytes.NewReader(data)) 
lex.next() // 获取 第 一 个 标记 
defer func() { 
// 注意 : 这 不 是 一 个 好 的 错误 处 理 示例 
if x := recover(); x != nil {- 
err = fmt.Errorf("error at %s: %v", lex.scan.Position, x) 


J 
}() 
read(lex, reflect.ValueOf(out).Elem()) 
return nil 


} 


一 个 具备 用 于 生产 环境 的 质量 的 实现 对 任何 的 输入 都 不 应 当 骨 溃 ， 而 且 应 当 对 每 次 错误 
详细 报告 信息 ， 可 能 的 话 ， 应 当 包 含 行 号 或 者 偏 移 量 。 无 论 如 何 ， 我 们 希望 这 个 示例 有 助 于 
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了 解 encoding/json 这 类 包 的 底层 机 制 ， 以 及 如 何 使 用 反射 来 填充 数据 结构 。 

练习 12.8 : 类 似 于 json.UnMarshal 函数 ，sexpr.Unmarshal 函数 在 解码 之 前 就 需要 完整 的 
字 节 slice。 仿 照 json.Decoder， 定 义 一 个 sexpr.Decoder 类 型 ， 人 允许 从 一 个 io.Reader 接口 解 
码 一 系列 的 值 。 使 用 这 个 新 类 型 来 重新 实现 sexpr.Unmarshal。 

练习 12.9 : 仿照 xml.Decoder (参考 7.14 节 )， 写 一 个 基于 标记 的 S 表达 式 解 码 API。 你 
需要 5 个 类 型 的 标记 : Symbol、String、Int、StartList 和 Endlist。 

练习 12.10 : 扩展 sexpr.unmarshal， 以 处 理 练 习 12.3 中 按 你 的 答案 编码 的 布尔 值 、 浮 
点 数 和 接口 。( 提 示 : 为 了 解码 接口 ， 你 需要 一 个 map, 其 中 包含 每 个 支持 类 型 从 名 字 到 
reflect .Type 的 映射 。) 


12.7 ”访问 结构 体 字段 标签 

在 4.5 节 我 们 用 结构 体 字 段 标签 来 修改 Go 结构 值 的 JSON 编码 方式 。json 字段 标签 
让 我 们 可 以 选择 其 他 的 字段 名 以 及 忽略 输出 的 空 字段 。 本 节 将 讨论 如 何 用 反射 来 获取 字段 
标签 。 

在 一 个 Web 服务 器 中 ， 绝 大 部 分 HTTP 处 理 函 数 的 第 一 件 事 就 是 提取 请 求 参数 到 局 部 
变量 中 。 我 们 将 定义 一 个 工具 函数 params.unpack， 使 用 结构 体 字段 标签 来 简化 HTTP 处 理 程 
序 (参考 7.7 节 ) 的 编写 。 

首先 ， 展 示 如 何 使 用 这 个 方法 。 下 面 的 search 函数 就 是 一 个 HTTP 处 理 函 数 ， 它 定义 
一 个 变量 data，data 的 类 型 是 一 个 字段 与 HTTP 请 求 参数 对 应 的 匿名 结构 。 结 构 体 的 字段 标 
签 指定 参数 名 称 ， 这 些 名 称 一 般 比 较 短 ， 含 义 也 比较 模糊 ， 毕 竟 URL 长 度 有 限 ， 不 能 随便 
浪费 。unpack 函数 从 请 求 中 提取 数据 来 填充 这 个 结构 体 ， 这 样 不 仅 可 以 更 方便 地 访问 ， 还 避 
免 了 手动 转换 类 型 。 

gopl.io/ch12/search 
import "gopl.io/ch12/params" 


// search 用 于 处 理 /search URL endpoint. 
func search(resp http.ResponseWriter, req *http.Request) { 
var data struct { 


Labels [string “http:"l™ 
MaxResults int “http: “max” 
Exact bool http: x 

} 

data.MaxResults = 16 // 设置 默认 值 

if err := params.Unpack(req, &data); err != nil 
http.Error(resp, err.Error(), http.StatusBadRequest) // 466 
return 

} 


// .其 他 处 理 代码 ... 
fmt.Fprintf(resp, "Search: %+v\n", data) 
} 


下 面 的 Unpack 函数 做 了 三 件 事情 。 首 先 ， 调 用 req.ParseForm() 来 解析 请 求 。 在 这 之 后 ， 
req.Form 就 有 了 所 有 的 请 求 参 数 ， 这 个 方法 对 HTTP GET 和 了 POST 请 求 都 适用 。 

接着 ，unpack 函数 构造 了 一 个 从 每 个 有 效 字段 名 到 对 应 字段 变量 的 映射 。 在 字段 有 标签 
时 有 效 字 段 名 与 实际 字段 名 可 能 会 有 差别 。reflect.Type 的 Field 方法 会 返回 一 个 reflect. 
structField 类 型 ， 这 个 类 型 提供 了 每 个 字段 的 名 称 、 类 型 以 及 一 个 可 选 的 标签 。 它 的 Tag 字 
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段 类 型 为 reflect.structTag， 底 层 类 型 为 字符 串 ， 提 供 了 一 个 Get 方法 用 于 解析 和 提取 对 于 
一 个 特定 键 的 子 串 ， 比 如 这 个 例子 中 用 到 的 http:"..."。 


Bop1. io/ch12/params 
// Unpack 从 HTTP 请 求 req 的 参数 中 提取 数据 填充 到 ptr 指向 结构 体 的 各 个 字段 
// from the HTTP request parameters in req. 
func Unpack(req *http.Request, ptr interface{}) error { 
if err := req.ParseForm(); err != nil { 
return err 


} 


// 创建 字段 映射 表 ， 键 为 有 效 名 称 
fields := make(map[string]reflect.Value) 
Vv := reflect.Value0Of(ptr).Elem() // 结构 变量 
for i := @; i < v.NumField(); i++ { 
fieldInfo := v.Type().Field(i) // a reflect.StructField 
tag := fieldInfo.Tag // a reflect.StructTag 
name := tag.Get("http") 
if name == "" { 
name = strings.ToLower(fieldInfo.Name) 


fields[name] = v.Field(i) 


} 
// 对 请 求 中 的 每 个 参数 更 新 结构 体 中 对 应 的 字段 
for name, values := range req.Form { 


f := fields[name] 
if !f.IsValid() { 
continue // 忽略 不 能 识别 的 HTTP 参数 


} 
for _, value := range values { 
if f.Kind() == reflect.Slice { 
elem := reflect.New(f.Type().Elem()).Elem() 
if err := populate(elem, value); err != nil { 
return fmt.Errorf("%s: %v", name, err) 
3} 
f.Set(reflect.Append(f, elem)) 
} else { 
if err := populate(f, value); err != nil { 
return fmt.Errorf("%s: %v", name, err) 
} 
} 
} 
return nil 


J. 


最 后 ，unpack 遍历 HTTP 参数 中 的 所 有 键 值 对 ， 并 且 更 新 对 应 的 结构 体 字段 。 注 意 ， 同 
一 个 参数 可 能 会 出 现 多 次 。 如 果 有 这 种 情况 并 且 字 段 是 slice 类 型 ， 则 这 个 参数 的 所 有 值 都 
会 追加 到 slice 里 。 如 果 不 是 ， 则 这 个 字段 会 被 多 次 覆盖 ， 仅 有 最 后 一 个 值 才 是 有 效 的 。 
populate 函数 负责 从 单个 HTTP 请 求 参数 值 填充 单个 字段 v (或 者 slice 字段 中 的 单个 元 
素 )。 现 在 ， 它 仅 支 持 字 符 串 、 有 符号 整数 和 布尔 值 。 支 持 其 他 类 型 则 留 作 练习 。 
func populate(v reflect.Value, value string) error { 
switch v.Kind() { 


case reflect.String: 
Vv.Setstring(value) 
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case reflect.Int: 


i, err := strconv.ParseInt(value, 106, 64) 
if err != nil { 

return err 
} 


v.SetInt(i) 


case reflect.Bool: 


b, err := strconv.ParseBool(value) 
if err l= nil { 
return err 


v.SetBool(b) 


default: 
return fmt.Errorf("unsupported kind %s", v.Type()) 


} 


return nil 


= 
接着 把 server 处 理 程序 添加 到 一 个 Web 服务 器 中 。 下 面 就 是 一 个 典型 的 交互 过 程 : 


$ go build gopl.io/ch12/search 

$ ./search & 

$ ./fetch 'http://localhost:12345/search'’ 

Search: {Labels:[] MaxResults:16 Exact:false} 

$ ./fetch 'http://localhost:12345/search?l=golang&l=programming" 
Search: {Labels:[golang programming] MaxResults:16 Exact:false} 

$ ./fetch 'http://localhost:12345/search?l=golang&l=programming&max=180" 
Search: {Labels:[golang programming] MaxResults:166 Exact:false} 

$ ./fetch 'http://localhost:12345/search?x=true&l=golang&l=programming" 
Search: {Labels:[golang programming] MaxResults:16 Exact:true} 

$ ./fetch 'http://localhost:12345/search?q=hello&x=123" 

x: strconv.ParseBool: parsing "123": invalid syntax 

$ ./fetch 'http://localhost:12345/search?q=hello&max=lots" 

max: strconv.ParseInt: parsing "lots": invalid syntax 


练习 12.11 : 写 一 个 与 Unpack 对 应 的 Pack 函数 。 给 定 一 个 结构 体 的 值 ，Pack 应 当 返 回 
一 个 URL， 这 个 URL 的 参数 与 输入 的 结构 体 对 应 。 

练习 12.12 : 扩展 字段 标签 语法 来 支持 参数 有 效 性 检验 。 比 如 ， 一 个 字符 串 应 当 是 一 
个 有 效 的 email 地 址 或 者 有 效 的 信用 卡号 码 ， 一 个 整数 应 当 是 一 个 有 效 的 美国 邮编 5 。 修 改 
unpack 函数 来 支持 这 些 功 能 。 

练习 12.13 : 修改 S 表 达 式 编码 器 (参考 12.4 节 ) 和 解码 器 (参考 12.6 节 )， 支 持 
sexpr:",.." 形式 的 字段 标签 ， 标 签 含义 同 encoding/json 包 (参考 4.5 节 )。 


12.8 显示 类 型 的 方法 
最 后 一 个 反射 示例 使 用 reflect.Type 来 显示 一 个 任意 值 的 类 型 并 枚 举 它 的 方法 : 


gopl.io/ch12/methods 
// Print 输出 值 x 的 所 有 方法 
func Print(x interface{}) { 
reflect.ValueOf(x) 


v.Type() 
mt.Printf("type %s\n", t) 





V 
息 
f 


日 美国 邮编 为 5 位 整数 。 一 一 译 者 注 
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for i := 0; i < v.NumMethod(); i++ { 
methType := v.Method(i).Type() 
fmt.Printf("func (%s) %s%s\n", t, t.Method(i).Name, 
strings.Trimprefix(methType.String(), "func")) 
} 
下 


reflect.Type 和 reflect.Value 都 有 一 个 叫 作 Method 的 方法 。 每 个 t.Method(i) (从 
reflect.Type 调用 ) 都 会 返回 一 个 reflect.Method 类 型 的 实例 ， 这 个 结构 类 型 描述 了 这 个 方 
法 的 名 称 和 类 型 。 而 每 个 v.Method(i) (从 reflect.Vvalue 调用 ) 都 会 返回 一 个 reflect.value， 
代表 一 个 方法 值 (6.4 节 )， 即 一 个 已 绑 定 接收 者 的 方法 。 使 用 reflect.value.call 方法 可 以 
调用 Func 类 型 的 value (为 节省 版 面 ， 这 里 就 不 演示 了 )， 但 这 个 程序 只 需要 它 的 类 型 。 

下 面 就 是 两 个 类 型 time.Duration 和 *strings.Replacer 的 方法 列表 : 

methods .Print(time.Hour) 

// 输出 : 

// type time.Duration 

// func (time.Duration) Hours() float64 

// func (time.Duration) Minutes() float64 

// func (time.Duration) Nanoseconds() int64 


// func (time.Duration) Seconds() float64 
// func (time.Duration) String() string 


methods.Print(new(strings.Replacer)) 

// 输出 : 

// type *strings.Replacer 

// func (*strings.Replacer) Replace(string) string 

// func (*strings.Replacer) Writestring(io.Writer, string) (int, error) 


12.9 注意 事项 


还 有 很 多 反射 API， 但 限于 篇 幅 原因 ， 这 里 不 再 展示 ， 但 之 前 的 示例 揭示 了 反射 能 做 
哪些 事情 。 反 射 是 一 个 功能 和 表达 能 力 都 很 强大 的 工具 ， 但 应 该 谨慎 使 用 它 ， 具 体 有 三 个 
原因 。 

第 一 个 原因 是 基于 反射 的 代码 是 很 脆弱 的 。 能 导致 编译 器 报告 类 型 错误 的 每 种 写法 ， 在 
反射 中 都 有 一 个 对 应 的 误 用 方法 。 编 译 器 在 编译 时 就 能 向 你 报告 这 个 错误 ， 而 反射 错误 则 要 
等 到 执行 时 才 以 崩溃 的 方式 来 报告 ， 而 这 可 能 是 代码 写 好 很 久 以 后 ， 甚 至 是 代码 开始 执行 很 
久 以 后 才 会 发 生 的 事 。 

比如 ， 如 果 readList 函数 (参考 12.6 节 ) 尝试 从 输入 读 取 一 个 字符 串 然后 填充 一 个 int 
类 型 的 变量 ， 那 么 调用 reflect.value.setstring 就 会 月 省。 很 多 使 用 反射 的 程序 都 有 类 似 的 
风险 ， 所 以 对 每 一 个 reflect.value 都 需要 仔细 注意 它 的 类 型 、 是 否 可 寻 址 、 是 否 可 设置 。 

回避 这 种 缺陷 的 最 好 办 法 是 确保 反射 的 使 用 完整 地 封装 在 包 里 边 ， 并 且 如 果 可 能 ， 在 包 
的 API 中 避免 使 用 reflect.value， 尽 量 使 用 特定 的 类 型 来 确保 输入 是 合法 的 值 。 如 果 做 不 
到 这 点 ， 那 就 需要 在 每 个 危险 操作 前 都 做 额外 的 动态 检查 。 作 为 标准 库 中 的 一 个 示例 ， 当 
fmt.Printf 遇 到 操作 数 类 型 不 合适 时 ， 它 不 会 莫名 奇妙 地 崩 演 ， 而 是 输出 一 条 描述 性 的 错误 
消息 。 尽 管 程序 仍然 有 bug， 但 定位 起 来 就 简单 多 了 。 


fmt.Printf("%d %s\n", "hello", 42) // "%!d(string=hello) %!s(int=42)" 


反射 还 降低 了 自动 重 构 和 分 析 工具 的 安全 性 与 准确 度 ， 因 为 它们 无 法 检测 到 类 型 信息 。 
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避免 使 用 反射 的 第 二 个 原因 是 类 型 其 实 也 算是 某 种 形式 的 文档 ， 而 反射 的 相关 操作 则 
无 法 做 静态 类 型 检查 ， 所 以 大 量 使 用 反射 的 代码 是 很 难 理解 的 。 对 于 接受 interface{} 或 者 
reflect.Value 的 函数 ， 一 定 要 写 清楚 期 望 的 参数 类 型 和 其 他 限制 条 件 〈《 即 不 变量 )。 

第 三 个 原因 是 基于 反射 的 函数 会 比 为 特定 类 型 优化 的 函数 慢 一 两 个 数量 级 。 在 一 个 典型 
的 程序 中 ， 大 部 分 函数 与 整体 性 能 无 关 ， 所 以 为 了 让 程序 更 清晰 可 以 使 用 反射 。 测 试 就 很 合 
适 使 用 反射 ， 因 为 大 部 分 测试 都 使 用 小 数据 集 。 但 对 于 关键 路 径 上 的 函数 ， 则 最 好 避免 使 用 
反射 。 
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Go 语言 的 设计 确保 了 一 些 安全 的 属性 从 而 限制 了 Go 程序 可 能 “出 错 ” 的 途径 。 在 编 
译 期 间 ， 类 型 检查 检测 那些 尝试 把 结果 赋 给 不 正确 类 型 的 操作 ， 例 如 ， 从 一 个 字符 串 减 去 另 
一 个 字符 串 。 严 格 的 类 型 转换 规则 阻止 了 直接 对 内 置 类 型 字符 串 、map 、slice 和 通道 的 内 部 
访问 。 

对 于 那些 无 法 静态 检测 的 错误 ， 例 如 数组 访问 越界 或 者 nil 指针 引用 ， 动 态 检 测 确保 程 
序 在 一 个 禁止 的 操作 发 生 的 时 候 立 即 终止 并 给 出 错误 提示 信息 。 自 动 内 存 管理 (垃圾 回收 ) 
防止 了 “释放 后 使 用 ”的 bug， 以 及 大 多 数 的 内 存 泄漏 。 

很 多 实现 的 细节 是 无 法 通过 Go 程序 来 访问 的 。 对 于 聚合 类 型 (如 结构 体 ) 的 内 存 布局 
或 者 一 个 函数 对 应 的 机 器 码 ， 就 无 法 了 解 识别 出 当前 运行 的 goroutine 所 在 的 线程 也 不 可 行 
事实 上 ，Go 协 程 调度 器 可 以 自由 地 将 goroutine 从 一 个 线程 移动 到 另 一 个 线程 。 指 针 会 识别 
所 引用 的 变量 ， 而 不 用 暴露 出 变量 的 地 址 。 在 垃圾 回收 的 过 程 中 ， 变 量 地 址 会 被 移动 ， 同 时 
指针 也 会 透明 地 更 新 。 

总 之 ， 这 些 特性 使 得 Go 程序 (尤其 是 那些 出 错 的 程序 ) 比 起 C 来 行为 更 加 可 预测 并 且 
减少 了 神秘 性 。 通 过 隐藏 底层 细节 ， 它 们 可 以 使 得 Go 程序 高 度 可 移植 ， 因 为 语言 的 语义 很 


漏 掉 了 ， 例 如 处 理 器 的 字 宽 度 ， 某 些 表 达 式 的 计算 顺序 ， 以 及 强加 给 编译 器 的 限制 性 实现 ) 

偶尔 ， 我 们 会 选择 放弃 一 些 有 益 的 保障 来 实现 最 可 能 的 高 性 能 ， 和 以 其 他 语言 编写 的 库 
进行 交互 或 者 实现 一 个 无 法 使 用 纯 Go 描述 的 函数 。 

本 章 将 揭示 包 unsafe 如 何 让 我 们 打破 常规 ， 以 及 如 何 使 用 cgo 工具 来 为 C 函数 库 和 系 
统 调用 创建 Go 语言 的 绑 定 。 

本 章 所 讲述 的 内 容 不 可 以 滥用 。 如 果 对 细节 部 分 不 深思 熟 虑 ， 将 会 带 来 各 种 不 可 预测 
的 、 奇 怪 的 、 非 局 部 性 错误 ，C 语言 的 程序 员 经 常 碰 到 这 些 问 题 。 使 用 unsafe 包 中 的 内 容 也 
无 法 保证 和 Go 未 来 的 发 布 版 兼容 ， 因 为 无 论 是 无 意 还 是 有 意 ， 这 个 包 里 面 的 内 容 都 会 依赖 
一 些 未 知 的 实现 细节 ， 而 它们 可 能 发 生 未 知 的 变化 。 

包 unsafe 是 很 神奇 的 ， 虽 然 它 像 普 通 的 包 并 且 像 普通 包 那 样 导入 ， 但 是 它 事实 上 是 由 纺 
译 器 实现 的 。 它 提供 了 对 语言 内 置 特性 的 访问 功能 ， 而 这 些 特性 一 般 是 不 可 见 的 ， 因 为 它们 
暴露 了 Go 详细 的 内 存 布局 。 把 这 些 特性 单独 放 在 一 个 包 中 ， 就 使 得 它们 的 本 来 就 不 频繁 的 使 
用 场合 变 得 更 加 引入 注目 。 另 外 ， 一 些 环境 下 ， 出 于 安全 原因 ，unsafe 包 的 使 用 是 受 限制 的 。 

包 unsafe 广泛 使 用 在 和 操作 系统 交互 的 低级 包 (比如 runtime、os、syscall 和 net) 中 ， 
但 是 普通 程序 从 来 不 需要 使 用 它 。 


13.1 unsafe.Sizeof、 Alignof 和 Offsetof 


蝴 数 unsafe.sizeof 报告 传递 给 它 的 参数 在 内 存 中 占用 的 字 节 长 度 ， 这 个 参数 可 以 是 任 
何 类 型 的 表达 式 ， 不 会 计算 表达 式 。sizeof 调用 返回 一 个 uintptr 类 型 的 常量 表达 式 ， 所 以 
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和 人 


这 个 结果 可 以 作为 数组 类 型 的 维度 或 者 用 于 计算 其 他 的 常量 。 
import "unsafe" 


fmt .Println(unsafe.Sizeof(float64(8) )) // "8" 


sizeof 仅 报 告 每 个 数据 结构 固定 部 分 的 内 存 占用 的 字 节 长 度 ， 例 如 指针 或 者 字符 串 的 长 
度 ， 但 是 不 会 报告 诸如 字符 串 内 容 这 种 间接 内 容 。 非 聚合 类 型 的 典型 长 度 如 下 所 示 ， 当 然 准 
确 的 长 度 随 工具 链 的 不 同 而 不 同 。 为 了 可 移植 性 ， 我 们 将 以 字 来 表示 引用 类 型 (或 者 包含 引 
用 的 类 型 ) 的 长 度 。 在 32 位 系统 上 ， 字 的 长 度 是 4 个 字 节 ; 而 在 64 位 系统 上 ， 字 的 长 度 是 
8 个 字 节 。 

在 类 型 的 值 在 内 存 中 对 齐 的 情况 下 ,计算机 的 加 载 或 者 写 入 会 很 高 效 。 例 如 ， 一 个 两 字 
节 值 (如 intl6 ) 的 地 址 应 该 是 一 个 偶数 ， 一 个 四 字 节 值 (如 rune) 的 地 址 应 该 是 4 的 整数 
人 省 ， 一 个 八字 节 值 (如 float64、uint64 或 者 64 位 指针 ) 的 地 址 应 该 是 8 的 整数 倍 。 更 大 整 
数 倍 的 对 齐 很 少见 ， 即 使 是 像 complex128 这 种 大 的 数据 类 型 。 

因此 ， 上 聚合 类 型 (结构 体 或 数组 ) 的 值 的 长 度 至 少 是 它 的 成 员 或 元 素 长 度 之 和 ， 并 且 由 
于 “内 存 间隙 ”的 存在 ， 或 许 比 这 个 更 大 一 些 。 内 存 空位 是 由 编译 器 添加 的 未 使 用 的 内 存 地 
址 ， 用 来 确保 连续 的 成 员 或 者 元 素 相对 于 结构 体 或 数组 的 起 始 地 址 是 对 齐 的 。 


类 型 大 小 

bool 1 个 字 

intN, uintN、 floatN、 complexN  N/8 字 节 ( 例 如 float64 是 8 字 节 ) 
int、 uint、 uintptr 1 个 字 

*T 1 个 字 

string 2 个 字 ( 数据、 长 度 ) 

[]T 3 个 字 ( 数据、 长 度 、 容 量 ) 
map 1 个 字 

func 1 个 字 

chan 1 个 字 

interface 两 个 字 (类 型 、 值 ) 


语言 规范 并 没有 要 求 成 员 声 明 的 顺序 对 应 内 存 中 的 布局 顺序 ， 所 以 在 理论 上 ， 编 译 器 可 
以 自由 安排 。 尽 管 这 样 说 ， 但 是 实际 上 没 人 这 样 做 。 如 果 结 构 体 成 员 的 类 型 是 不 同 的 ， 那 
么 将 相同 类 型 的 成 员 定义 在 一 起 可 以 更 节约 内 存 空间 。 例 如 下 面 的 三 个 结构 体 拥有 相同 的 成 
员 ， 但 是 第 一 个 定义 比 其 他 两 个 定义 要 多 占 至 多 50% 的 内 存 。 


， // 64 位 32 位 
struct{ bool; float64; int16 } // 3 个 字 4 个 字 
struct{ float64; int16; bool } // 两 个 字 3 个 字 
struct{ bool; int16; float64 } // 两 个 字 3 个 字 


对 齐 算法 的 细节 已 经 超出 本 书 的 范围 了 ， 同 时 不 值得 担心 每 个 结构 体 的 内 存 布局 ， 但 是 
在 为 高 效 组 合 的 数据 结构 经 常 分 配 内 存 的 时 候 可 以 更 加 紧凑 、 快 速 。 

函数 unsafe.Alignof 报告 它 参 数 类 型 所 要 求 的 对 齐 方式 。 和 sizeof 一 样 ， 它 的 参数 可 以 
是 任意 类 型 的 表达 式 ， 并 且 返 回 一 个 常量 。 典 型 地 ， 布 尔 类 型 和 数值 类 型 对 齐 到 它们 的 长 度 
(最 大 8 字 节 )， 而 其 他 的 类 型 则 按 字 对 齐 。 

函数 unsafe.offsetof ， 计 算 成 员 f 相对 于 结构 体 x 起 始 地址 的 偏 移 值 ， 如 果 有 内 存 空 
位 ， 也 计算 在 内 ， 该 函数 的 操作 数 必须 是 一 个 成 员 选 择 器 x.f。 

图 13-1 演示 了 一 个 结构 体 变 量 x 和 它 在 典型 的 32 位 和 64 位 系统 上 的 内 存 布局 。 灰 色 
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的 部 分 都 是 内 存 空位 。 


var x struct { 
a bool 
b int16 
c [Jint 





加。 本 到 











c(cap) 
(32 位 ) (64 位 ) 
图 13-1 结构 体 中 的 内 存 空位 








下 面 的 代码 演示 了 对 结构 体 x 以 及 x 的 三 个 成 员 调用 unsafe 的 三 个 函数 的 结果 : 
在 典型 的 32 位 平台 上 : 


Sizeof(x) = 16 Alignof(x) = 4 

Sizeof(x.a) = 1 Alignof(x.a) = 1 Offsetof(x.a) = 6 
Sizeof(x.b) = 2 Alignof(x.b) = 2 Offsetof(x.b) = 2 
Sizeof(x.c) = 12 Alignof(x.c) = 4 Offsetof(x.c) = 4 
在 典型 的 64 位 平台 上 : 

Sizeof(x) = 32 Alignof(x) = 8 


Sizeof(x.a) = 1 Alignof(x.a) = 1 Offsetof(x.a) = 6 
Sizeof(x.b) = 2 Alignof(x.b) = 2 Offsetof(x.b) = 2 
Sizeof(x.c) = 24 Alignof(x.c) = 8 Offsetof(x.c) = 8 


虽然 它们 的 名 字 叫 作 unsafe， 但 是 这 些 函 数 本 身 是 安全 的 ， 并 且 在 做 内 存 优化 的 时 候 ， 
它们 对 理解 程序 底层 内 存 布局 很 有 帮助 。 


13.2 unsafe.Pointer 


很 多 指针 类 型 都 写作 *T， 意 思 是 “一 个 指向 T 类 型 变量 的 指针 ”。 unsafe.Pointer 类 
型 是 一 种 特殊 类 型 的 指针 ， 它 可 以 存储 任何 变量 的 地 址 。 当 然 ， 我 们 无 法 间接 地 通过 一 个 
unsafe.Pointer 变量 来 使 用 *p， 因 为 我 们 不 知道 这 个 表达 式 的 具体 类 型 。 和 普通 的 指针 一 
样 ，unsafe.Pointer 类 型 的 指针 是 可 比较 的 并 且 可 以 和 nil 做 比较 ，nil 是 指针 类 型 的 零 值 

一 个 普通 的 指针 *T 可 以 转换 为 unsafe.pointer 类 型 的 指针 ， 另 外 一 个 unsafe.pointer 类 
型 的 指针 也 可 以 转换 回 普通 指针 ， 而 且 可 以 不 必 和 原 来 的 类 型 *T 相同。 例如 ， 通 过 转换 一 
个 *float64 类 型 的 指针 到 *uint64 类 型 ， 可 以 查看 一 下 浮 点 类 型 变量 的 位 模式 ， 

package math 

func Float64bits(f float64) uint64 { return *(*uint64)(unsafe.Pointer(&f)) } 


fmt.Printf("%#016x\n", Float64bits(1.0)) // "8x3ff688686668688866" 


也 可 以 通过 结果 指针 来 更 新 位 模式 。 这 个 对 一 个 浮 点 类 型 的 变量 来 说 是 无 害 的 ， 但 是 通常 
使 用 unsafe.Pointer 进行 类 型 转换 可 以 让 我 们 将 任意 值 写 和 内存 中 ， 并 因此 破坏 了 类 型 系统 ， 

unsafe.Pointer 类 型 也 可 以 转换 为 uintptr 类 型 ，uintptr 类 型 保存 了 指针 所 指向 地 址 的 
数值 ， 这 就 可 以 让 我 们 对 地 址 进行 数值 计算 。( 回 忆 一 下 第 3 音 ,，uintptr 类 型 是 一 个 足够 大 
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的 无 符号 整 型 ， 可 以 用 来 表示 任何 地 址 。) 这 种 转换 当然 也 可 以 反 过 来 ， 但 是 这 种 从 uintptr 
到 unsafe.Pointer 的 转换 也 会 破坏 类 型 系统 ， 因 为 并 不 是 所 有 的 数值 都 是 合法 的 内 存 地 址 。 

很 多 unsafe.Pointer 类 型 的 值 都 是 从 普通 指针 到 原始 内 存 地 址 以 及 再 从 内 存 地 址 到 普通 
指针 进行 转换 的 中 间 值 。 下 面 的 例子 获取 变量 x 的 地 址 ， 然 后 加 上 其 成 员 b 的 地 址 偏 移 量 ， 
并 将 结果 转换 为 *int16 指针 类 型 ， 接 着 通过 这 个 指针 更 新 x.b 的 值 。 


gopl.io/ch13/unsafeptr 





var x struct { 
a bool 
5 int16 
e. [J]int 

} 


// 等 代 于 to pb := &x.b 

pb := (*int16) (unsafe.Pointer( 
uintptr(unsafe.Pointer(&x)) + unsafe.Offsetof(x.b))) 

*pb = 42 


fmt.Println(x.b) // "42" 

虽然 这 种 语法 看 上 去 很 见长， 这 或 许 也 不 是 坏事 ， 因 为 这 些 特性 不 应 该 被 随意 使 用 ,但 
是 不 要 尝试 引入 uintptr 类 型 的 临时 变量 来 破坏 整 行 代码 。 下 面 这 段 代码 是 不 正确 的 : 

// 注意 : 很 微妙 的 错误 

tmp := uintptr(unsafe.Pointer(&x)) + unsafe.Offsetof(x.b) 

pb := (*int16)(unsafe.Pointer(tmp)) 

*pb = 42 

原因 很 微妙 。 一 些 垃 圾 回收 器 在 内 存 中 把 变量 移 来 移 去 以 减少 内 存 碎片 或 者 为 了 进 
行 短 记 工作 。 这 种 类 型 的 垃圾 回收 器 称 为 移动 的 垃圾 回收 器 。 当 一 个 变量 在 内 存 中 移动 
后 ， 该 变量 所 指向 旧地 址 的 所 有 指针 都 需要 更 新 以 指向 新 地 址 。 从 垃圾 回收 器 的 角度 看 ， 
unsafe.Pointer 是 一 个 变量 的 指针 ， 当 变量 移动 的 时 候 ， 它 的 值 也 需要 改变 ， 而 uintptr 仅仅 是 
一 个 数值 ， 所 以 它 的 值 是 不 会 变 的 。 上 面 的 错误 代码 使 得 垃圾 回收 器 无 法 通过 到 非 指针 变量 
tmp 了 解 它 背后 的 指针 。 当 第 二 条 语句 执行 的 时 候 ， 变 量 x 可 能 在 内 存 中 已 经 移动 了 ， 这 个 时 
候 tmp 中 的 值 就 不 是 变量 &x.b 的 地 址 了 。 第 三 条 语句 将 向 一 个 任意 的 内 存 地 址 写 人 值 42。 

上 面 的 问题 会 导致 很 多 其 他 的 错误 写法 。 例 如 在 这 条 语句 执行 之 后 ， 将 没有 指针 指向 
new 创建 的 那个 变量 。 


pT := uintptr(unsafe.Pointer(new(T))) // 注意 : 错误 


在 这 种 情况 下 ， 垃 圾 回收 器 将 会 在 语句 执行 结束 后 回收 内 存 ， 在 这 之 后 ，pT 存储 的 是 变 
量 旧 的 地 址 ， 不 过 这 个 时 候 这 个 地 址 对 应 的 已 经 不 是 那个 变量 了 。 

当前 版 本 的 Go 实现 没有 使 用 移动 垃圾 回收 器 (尽管 未 来 可 能 会 )， 但 是 不 要 暗自 庆幸 ， 
因为 当前 版 本 的 Go 确实 会 在 内 存 中 移动 变量 。 回 忆 一 下 5.2 节 ，goroutine 栈 会 根据 需要 增 
长 。 这 个 时 候 ， 旧 栈 上 面 的 所 有 的 变量 会 重新 分 配 到 新 的 、 更 大 的 栈 上 面 ， 所 以 我 们 不 能 指 
望 变量 的 地 址 值 在 它 的 整个 生命 周期 都 不 会 变 。 

在 本 书 撰写 的 时 候 ， 在 将 unsafe.Pointer 转换 为 uintptr 之 后 ， 并 没有 什么 清晰 的 指导 
意见 可 以 让 Go 程序 员 人 参考 (可 以 看 Go issue 7192 )， 所 以 我 们 强烈 建议 你 遵守 最 小 可 用 原 
则 。 可 认为 所 有 的 uintptr 值 都 包含 一 个 变量 的 旧地 址 ， 并 且 减 少 unsafe.pointer 到 uintptr 
之 间 的 转换 到 使 用 这 个 uintptr 之 间 的 操作 次 数 。 在 上 面 的 第 一 个 例子 中 ， 转 换 为 uintptr， 
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加 上 成 员 地 址 偏 移 量 ， 然 后 再 转换 回来 ， 都 是 在 一 条 语句 中 实现 的 。 
当 调 用 一 个 返回 uintptr 类 型 的 库 函 数 时 ， 例 如 下 面 reflect 包 中 国 数 所 返回 的 值 ， 这 
些 结果 应 该 立刻 转换 为 unsafe.Pointer 来 确保 它们 在 接 下 来 的 代码 中 继续 指向 同一 个 变量 。 
package reflect 


func (Value) Pointer() uintptr 
func (Value) UnsafeAddr() uintptr 
func (Value) InterfaceData() [2]uintptr // (索引 1) 


13.3 示例: 深度 相等 


包 reflect 中 的 DeepEqual 函数 用 来 报告 两 个 变量 的 值 是 否 “ 深 度 ” 相 等 。DeepEqual 加 
数 对 基本 类 型 使 用 内 置 的 == 操作 符 进行 比较 ; 对 于 组 合 类 型 ， 它 逐 层 深入 比较 相应 的 元 素 。 
因为 这 个 函数 适合 于 任意 一 对 变量 值 ， 甚 至 是 那些 无 法 通过 == 来 进行 比较 的 值 ， 所 以 这 个 
函数 在 测试 中 广泛 使 用 。 下 面 的 测试 使 用 DeepEqual 来 比较 两 个 []string 类 型 的 值 : 


func TestSplit(t *testing.T) { 
got := strings.Split("a:b:c", ":") 
want := []string{"a", "b", "c"}; 
if Ireflect.DeepEqual(got, want) { /* ... */ } 
} 
虽然 DeepEqual 很 方便 ， 但 是 它 的 特点 就 是 判断 过 于 武断 。 例 如 ， 它 不 会 认为 一 个 值 为 
nil 的 map 和 一 个 值 不 为 nil 的 空 map 相等 ， 也 不 会 判断 出 一 个 值 为 nil 的 slice 和 一 个 值 
不 为 nil 的 空 slice 相等 。 


var a, b []string = nil, []string{} 
fmt.Println(reflect.DeepEqual(a, b)) // "false" 


var c, d map[string]int = nil, make(map[string]int) 
fmt.Println(reflect.DeepEqual(c, d)) // "false" 


在 本 节 ， 我 们 将 定义 一 个 函数 Equal 来 比较 两 个 任意 类 型 的 值 。 和 DeepEqual 类 似 ， 它 
基于 值 来 比较 slice 和 map， 但 是 和 peepEqual 不 同 的 是 ， 它 认为 一 个 值 为 nil 的 slice 或 
map 和 一 个 值 不 为 nil 的 空 slice 或 map 相等 。 对 参数 的 基本 递归 检查 可 以 通过 反射 来 实现 ， 
方式 和 12.3 节 看 过 的 Display 程序 类 似 。 和 平常 一 样 ， 我 们 定义 一 个 未 导出 函数 equal 用 来 
进行 递归 检查 。 现 在 不 用 关心 参数 seen。 对 于 每 对 进行 比较 的 值 x 和 y，equal 函数 检查 两 者 
是 否 合法 以 及 它们 是 否 具有 相同 的 类 型 。 函 数 的 结果 通过 switch 的 case 语句 返回 ,在 case 
语句 中 比较 两 个 相同 类 型 的 值 。 为 了 节约 篇 幅 ， 我 们 目前 已 经 很 熟悉 的 类 型 就 省 略 了 。 

gopl1.io/ch13/equal 

func equal(x, y reflect.Value, seen map[comparison]bool) bool { 


if !x.IsValid() || !y.IsValid() { 
return x.IsValid() == y.IsValid() 


} 

if x.Type() != y.Type() { 
return false 

} 


// .…. 省 略 了 循环 检查 (参见 后 面 ) .. . 


switch x.Kind() { 
case reflect.Bool : 
return x.Bool() == y.Bool() 
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case reflect.string: 
return x.String() == y.String() 


// .…. 为 了 简洁 ， 数 值 类 型 就 省 略 了 ... 


case reflect.Chan, reflect.UnsafePointer, reflect.Func: 
return x.Pointer() == y.Pointer() 


case reflect.Ptr, reflect.Interface: 
return equal(x.Elem(), y.Elem(), seen) 


case reflect.Array, reflect.Slice: 
if x.Len() != y.Len() { 
return false 


} 
for i := 6@; i < x.Len(); i++ { 
if lequal(x.Index(i), y.Index(i), seen) { 
return false 


} 
} 


return true 
// .…. 为 了 简洁 ， 结 构 体 和 map 类 型 就 省 略 了 ... 
} 


panic("unreachable") 


} 


和 通常 一 样 ， 在 API 中 不 暴露 使 用 反射 的 细节 ， 所 以 导出 的 Equal 函数 必须 对 参数 显 式 
调用 reflect.Valueof 困 数 。 


// Equal 函数 检查 x 和 y 是 否 深度 相等 
func Equal(x, y interface{}) bool { 

seen := make(map[comparison]bool) 

return equal(reflect.ValueOf(x), reflect.ValueOof(y), seen) 
} 


type comparison struct { 
x, y unsafe.Pointer 
t reflect.Type 

} 


为 了 确保 算法 终止 甚至 可 以 对 循环 数据 结构 进行 比较 ， 它 必须 记录 哪 两 对 变量 已 经 比较 
过 了 ,并且 避免 再 次 进行 比较 。Equal 函数 分 配 了 一 个 叫 作 comparison 的 结构 体 集合 ， 每 个 
元 素 都 包含 两 个 变量 的 地 址 (使 用 unsafe.Pointer 值 表示 ) 以 及 比较 的 类 型 。 除 了 变量 的 地 
址 外 ， 还 需要 记录 比较 的 类 型 ， 因 为 不 同 的 变量 可 能 拥有 相同 的 地 址 。 例 如 ， 如 果 x 和 y 都 
是 数组 ，x 和 x[e] 的 地 址 是 一 样 的 ， 当 然 y 和 >y[e] 的 地 址 也 一 样 ， 这 个 时 候 区 分 开 是 比较 
了 x 和 y 还 是 比较 了 x[e] 和 y[e] 就 很 重要 。 

当 equal 发 现 它 的 两 个 参数 类 型 相同 的 时 候 ， 在 执行 switch 语句 进行 比较 之 前 ， 它 检查 
这 两 个 变量 是 否 已 经 比较 过 了 ， 如 果 已 经 比较 过 ， 则 终止 这 次 递归 比较 。 


// 循环 检查 

if x.CanAddr() && y.CanAddr() { 
xptr := unsafe.Pointer(x.UnsafeAddr()) 
yptr := unsafe.Pointer(y.UnsafeAddr()) 
if xptr == yptr { 

return true // identical references 

} 
c := comparison{xptr, yptr, x.Type()} 
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if seen[c] { 
return true // already seen 


seen[c] = true 


这 里 是 Equal 函数 的 实际 例子 : 


fmt.Println(Equal([]int{1, 2, 3}, [Jint{1, 2, 3})) // "true" 
fmt.Println(Equal([]string{"foo"}, []string{"bar"})) // "false" 
fmt.Println(Equal([]string(nil), []string{})) /A “true” 


fmt.Println(Equal(map[string]int(nil), map[string]int{})) // "true" 
它 甚至 适用 于 循环 输入 ， 这 和 12.3 节 使 得 Display 函数 在 循环 中 卡 住 的 循环 输入 类 似 。 


// 循环 链表 a -> b -> a 和 c -> < 
type link struct { 
value string 
tail *link 
由 
a, b, c := &link{value: "a"}, &link{value: "b"}, &link{value: "c"} 
a.tail, b.tail, c.tail = b, a, c 
fmt.Println(Equal(a, a)) // "true" 
fmt.Println(Equal(b, b)) // "true" 
fmt.Println(Equal(c, c¢)) // "true" 
fmt.Println(Equal(a, b)) // "false" 
fmt.Println(Equal(a, c¢)) // "false" 
练习 13.1: 定义 一 个 深度 比较 函数 ， 该 函数 把 数值 (任何 类 型 ) 之 间 的 差 小 于 10” 视 为 
相等 。 


练习 13.2: 编写 一 个 函数 来 判断 它 的 参数 是 否 是 一 个 循环 数据 结构 体 。 


13.4 使 用 cgo 调用 C 代码 


一 个 Go 程序 或 许 需要 调用 用 C 实现 的 硬件 驱动 程序 ， 查 询 一 个 用 C++ 实现 的 艇 人 式 
数据 库 ， 或 者 使 用 一 些 以 Fortran 实现 的 线性 代数 协 程 。C 作为 一 种 编程 混合 语言 已 经 很 久 
了 ， 所 以 无 论 那 些 广泛 使 用 的 包 是 哪 种 语言 实现 的 ， 它 们 都 导出 了 和 C 兼容 的 API。 

在 本 节 ， 我 们 将 使 用 cgo 来 构建 一 个 简单 的 数据 压缩 程序 ，cgo 是 用 来 为 C 函数 创建 Go 
绑 定 的 工具 。 诸 如 此 类 的 工具 都 叫 作 外 部 函数 接口 (FFI)， 并 且 cgo 不 是 Go 程序 唯一 的 工 
具 。SWIG (swig.org) 是 另 一 个 工具 ; 它 提供 了 更 加 复杂 的 特性 用 来 集成 C++ 的 类 ， 但 是 
这 里 不 打算 演示 。 a 

标准 库 的 compress/... 子 包 中 提供 了 流行 压缩 算法 的 压缩 器 和 解压 缩 器 ,包括 Lzw 
(UNIX 工具 compress 使 用 的 算法 ) 和 DEFLATE (GNU 工具 gzip 使 用 的 算法 )。 这 些 包 中 的 API 
有 些许 的 不 同 ， 但 是 它们 都 提供 一 个 对 io.writer 的 封装 用 来 对 写 人 的 数据 进行 压缩 ， 并 且 
还 有 一 个 对 io.Reader 的 封装 ， 当 从 中 读 取 数据 的 同时 进行 解压 缩 。 例 如 : 

package gzip // compress/gzip 


func NewWriter(w io.Writer) io.WriteCloser 
func NewReader(r io.Reader) (io.ReadCloser, error) 


bzip2 算法 基于 优雅 的 Burrows-Wheeler 变换 ， 它 比 gzip 运行 起 来 慢 但 是 可 以 得 到 更 好 
的 压缩 效果 。 包 compress/bzip2 提供 了 bzip2 的 解压 缩 器 ， 但 是 目前 该 包 还 没有 提供 压缩 功 
能 。 从 头 开 始 开发 工作 量 较 大 ， 但 是 恰好 有 一 个 文档 完善 且 高 性 能 的 的 开源 C 语言 实现 : 来 
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自 bzip.org 的 libbzip2 包 。 

如 果 C 库 很 小 ， 我 们 可 以 使 用 纯 Go 语言 来 移植 它 ， 并 且 如 果 性 能 对 我 们 来 说 不 是 很 
关键 ， 我 们 最 好 使 用 包 os/exec 以 辅助 子 进程 的 方式 来 调用 C 程序 。 仅 当 你 需要 使 用 拥有 有 
限 C API 并 且 复 杂 的 、 性 能 关键 的 库 时 ， 使 用 cgo 来 把 它们 包装 成 Go 语言 的 绑 定 才 有 意义 。 
本 节 剩 下 的 部 分 将 通过 一 个 例子 来 说 明 。 

从 C 的 包 libbzip2 中 ， 我 们 需要 结构 体 类 型 bz_stream， 这 个 结构 体 包含 输入 和 输出 组 
冲 区 ， 以 及 三 个 C 函数 : 8Bz2_bzcompressInit， 它 用 来 分 配 流 的 缓冲 区 ; 8z2_bzcompress， 它 
用 来 压缩 输入 缓冲 区 中 的 数据 并 写 出 到 输出 缓冲 区 ; 以 及 Bz2_bzcompressEnd， 它 用 来 释放 组 
冲 区 。( 不 用 担心 libbzip2 包 的 工作 机 制 ， 本 例 的 目的 就 是 演示 各 部 分 如 何 一 起 工作 。) 

我 们 从 Go 语言 中 直接 调用 C 函数 Bz2_bzCompressInit 和 BZ2_bzcompressEnd， 但 是 对 于 
BZ2_bzCompress 函数 ， 我 们 使 用 C 语言 定义 个 了 包装 函数 ， 来 演示 它 如 何 使 用 。 下 面 的 C 源 
文件 和 Go 代码 都 在 包 中 : 

gopl.io/ch13/bzip 
/* 文件 是 gopl.io/ch13/bzip/bzip2.c */ 


/* 对 libbzip2 的 简单 包装 适合 cgo + 
#include <bzlib.h> 


int bz2compress(bz_stream *s, int action, 
char *in, unsigned *inlen, char *out, unsigned *outlen) { 
s->next_in = in; 
s->avail in = *inlen; 
S->next_out = out; 
s->avail out = *outlen; 
int r = BZ2 bzCompress(s, action); 


*inlen -= Ss->avail_in; 
*outlen -= s->avail out; 
return r; 


} 


现在 我 们 来 看 Go 代码 ， 第 一 部 分 如 下 所 示 。 声 明 import "c" 很 特别 。 没 有 包 的 名 字 是 
c, 但 是 这 个 导入 会 在 Go 编译 器 看 到 它 之 前 促使 go build 利用 cgo 工具 预 处 理 文件 。 


// 包 bzip 封装 了 一 个 使 用 bzip2 压缩 算法 的 writer(bzip.org) 
package bzip 


/* 
#cgo CFLAGS: -I/usr/include 
#cgo LDFLAGS: -L/usr/lib -lbz2 
#include <bzlib.h> 
int bz2compress(bz_stream *s, int action, 
char *in, unsigned *inlen, char *out, unsigned *outlen); 
本 
import "C" 
import ( 
"io" 
"unsafe" 


) 


type writer struct { 
Ww io.Writer // 基本 输出 流 
stream *C.bz_stream 
outbuf [64 * 1624]byte 

} 
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// NewWriter 对 于 bzip2 压缩 的 流 返 回 一 个 writer 
func Newwriter(out io.Writer) io.WriteCloser { 


const ( 
blockSsize = 9 
verbosity = 6 
workFactor = 36 


:= &writer{w: out, stream: C.bz2alloc()} 
C.BZ2_bzCompressInit(w.stream, blockSize, verbosity, workFactor) 
return w 

} 

在 预 处 理 过 程 中 ，cgo 产生 一 个 临时 包 ， 这 个 包 里 面包 含 了 所 有 C 函数 和 类 型 对 应 的 
Go 语言 声明 ， 例 如 c.bz_stream 和 Cc.BZ2_bzCompressInit。cgo 工具 通过 以 一 种 特殊 的 方式 调 
用 C 编译 器 import"c" 声明 之 前 的 注释 来 发 现 这 些 类 型 。 

这 些 注释 还 可 以 包含 #cgo 指令 用 来 指定 C 工具 链 中 其 他 的 选项 。cFLAGs 和 LpFLAGs 的 值 
将 为 编译 器 和 链接 器 命令 指定 额外 的 参数 ， 用 来 发 现 头 文件 bzlib.h 和 归档 库 1ibbz2.a。 这 
个 例子 假定 它们 都 在 系统 的 /usr 目录 下 。 根 据 个 人 的 安装 情况 ， 你 或 许 需要 修改 或 者 删除 
这 些 标 记 。 

Newwriter 调用 C 函数 Bz2_bzcompressInit 来 初始 化 流 的 缓冲 区 。 这 个 writer 类 型 包含 
一 个 额外 的 缓冲 区 用 来 耗 尽 解压 缩 器 的 输出 缓冲 区 。 

下 面 所 示 的 write 方法 将 未 压缩 的 数据 写 和 人 压缩 器 中 ， 然 后 在 一 个 循环 中 调用 
bz2compress 消 数 ， 直 到 所 有 的 数据 压缩 完毕 。 注 意 ，Go 程序 可 以 访问 C 的 类 型 (比如 
bz_stream、char 和 uint), C 的 函数 (比如 bzzcompress)， 甚 至 是 类 似 C 的 预 处 理 宏 的 对 象 ( 例 
如 Bz_RUN)， 都 通过 c.x 的 方式 来 访问 。 即 使 类 型 c.uint 和 Go 的 uint 的 长 度 相 同 ， 它 们 的 
类 型 也 不 同 。 

func (w *writer) Write(data []byte) (int, error) { 


if w.stream == nil { 
panic("closed") 


var total int // 写 入 的 未 压缩 字 节 
for len(data) > 6 { 
inlen，outlen := C.uint(len(data)), C.uint(cap(w.outbuf)) 
C.bz2compress(w.stream, C.BZ_RUN, 
(*C.char)(unsafe.Pointer(&data[6]))，&inlen， 
(*C.char)(unsafe.Pointer(&w.outbuf)), &outlen) 
total += int(inlen) 
data = data[inlen:] 
if _, err := W.w.Write(w.outbuf[:outlen]); err != nil { 
return total, err 


} 


return total, nil 


} 


每 次 循环 都 会 将 剩余 data 的 地 址 和 长 度 ， 以 及 w.outbuf 的 地 址 和 容量 传递 给 函数 
bz2compress。 两 个 表示 长 度 的 变量 是 通过 它们 的 地 址 来 传递 的 ， 而 不 是 值 ， 这 样 c 函数 就 可 
以 更 新 它们 以 此 了 解压 缩 了 多 少数 据 以 及 生成 了 多 少 压 缩 后 的 数据 。 然 后 把 每 块 压缩 后 的 数 
据 写 人 底层 io.writer。 

close 方 法 和 write 方法 结构 相似 ， 使 用 一 个 循环 来 将 任何 剩余 的 压缩 后 的 数据 从 输出 


低级 编程 


流 缓冲 区 写 人 底层 。 


// Close 方法 清空 压缩 的 数据 并 关闭 流 
// 它 不 会 关闭 底层 的 io.Writer 
func (w *writer) Close() error { 
if w.stream == nil { 
panic("closed") 





} 

defer func() { 
C.BZ2_bzCompressEnd(w.stream) 
C.bz2free(w.stream) 
w.stream = nil 


}() 
for { 
inlen, outlen := C.uint(6)，C.uint(cap(w.outbuf) ) 
r := C.bz2compress(w.stream, C.BZ_FINISH, nil, &inlen, 
(*C.char)(unsafe.Pointer(&w.outbuf)), &outlen) 
if _, err := Ww.w.Write(w.outbuf[:outlen]); err != nil { 
return err 


if r == C.BZ_STREAM END { 
return nil 
} 
} 

} 

完成 之 后 ，Close 方法 调用 c.Bz2_bzcompressEnd 来 释放 流 缓冲 区 ,使 用 defer 来 确保 所 
有 路 径 返 回 后 一 定 会 释放 资源 。 在 这 个 时 候 ，w. stream 指针 就 不 能 安全 地 解 引用 了 。 为 了 安 
全 ， 把 它 设置 为 mil1， 并 且 为 每 个 方法 调用 都 添加 显 式 的 nil 检查， 这 样 如 果 用 户 在 close 
之 后 错误 地 调用 一 个 方法 该 程序 就 会 宕 机 。 

不 但 writer 不 是 并 发 安全 的 ， 而 且 并 发 调用 close 和 write 也 会 导致 C 代码 前 溃 。 在 练 
习 13.3 中 修复 它 。 

下 面 的 程序 bzipper 是 一 个 使 用 了 新 包 的 bzip2 压缩 器 命令 。 它 和 很 多 UNIX 系统 上 面 
的 bzip2 命令 相似 。 

gopl.io/ch13/bzipper 


// Bzipper 读 取 输入 ,使 用 bzip2 压缩 然后 输出 数据 
package main 


import ( 
"io" 
"log" 
"os" 


"gopl.io/ch13/bzip" 


func main() { 
w := bzip.NewWriter(os.Stdout) 
if _, err := io.Copy(w, os.Stdin); err != nil { 
log.Fatalf("bzipper: %v\n", err) 


} 

if err = WiClose(); err l= nil { 
log.Fatalf("bzipper: close: %v\n", err) 

} 


} 


在 下 面 的 部 分 ， 使 用 bzipper 来 压缩 /usr/share/dict/words 文件 ， 这 个 文件 是 系统 的 字 
典 ， 我 们 把 它 从 938 848 个 字 节 压缩 到 335 495 个 字 节 ， 将近 是 原来 的 1/3 大 小 ， 然 后 再 使 
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用 系统 命令 bunzip2 来 解压 缩 它 。 我 们 检查 压缩 前 和 解压 缩 后 的 文件 发 现 它们 的 sha256 散 列 
值 是 一 致 的 ， 因 此 我 们 相信 我 们 实现 的 压缩 器 是 正确 的 。( 如 果 你 系统 上 面 没有 sha256sun 命 
令 ， 那么 使 用 练习 4.2 的 答案 。) 


$ go build gopl.io/ch13/bzipper 

$ wc -c < /usr/share/dict/words 

938848 

$ sha256sum < /usr/share/dict/words 
126a4ef38493313edc56b86f96dfdaf7c59ec6c948451eac228f2f3a8ab1la6ed - 
$ ./bzipper < /usr/share/dict/words | wc -c 

335465 

$ ./bzipper < /usr/share/dict/words | bunzip2 | sha256sum 
126a4ef38493313edc56b86f96dfdaf7c59ec6c948451eac228f2f3a8ab1a6ed - 


我 们 演示 了 如 何 将 C 库 链 接 进 Go 程序 中 。 反 过 来 ， 可 以 将 Go 程序 编译 为 静态 库 然后 
链接 进 C 程序 中 ， 也 可 以 编译 为 动态 库 通过 C 程序 来 加 载 和 共享 。 这 里 仅 讲 解 了 cgo 很 浅 
显 的 知识 ， 另 外 关于 内 存 管理 、 指 针 、 回 调 、 信 和 号 处 理 、 字 符 串 、 错 误 处 理 、 析 构 器 以 及 
goroutine 和 系统 线程 的 关系 等 还 有 很 多 内 容 ， 其 中 很 多 内 容 都 很 微妙 。 尤 其 是 ， 正 确 地 从 
GO 传递 指针 给 C 以 及 反 向 传递 的 过 程 都 很 复杂 ， 原 因 和 13.2 节 讨论 过 的 内 容 相 似 ， 并 且 
当前 也 还 没有 权威 的 解释 。 如 果 想 了 解 更 多 的 内 容 ， 可 以 访问 https://golang.org/cmd/cgo。 

练习 13.3: 使 用 sync.Mutex 来 使 得 bzip.writer 在 多 goroutine 的 情况 下 可 以 安全 使 用 。 

练习 13.4: 依赖 C 函数 库 的 实现 是 有 缺点 的 。 请 使 用 另外 一 个 bzip.Newwriter 的 纯 Go 
实现 ， 它 使 用 os/exec 包 将 /bin/bzip2 作为 一 个 子 进程 执行 。 


13.5 ”关于 安全 的 注意 事项 


上 一 章 结尾 对 反射 接口 的 使 用 方法 给 出 了 警告 。 这 些 警 告 对 于 本 章 讲解 的 包 unsafe 更 
加 适用 。 

高 级 语言 将 程序 、 程 序 员 和 神秘 的 机 器 指令 集 隔 离开 来 ， 并 且 也 隔离 了 诸如 变量 在 内 存 
中 的 存储 位 置 ， 数 据 类 型 有 多 大 ， 数 据 结构 的 内 存 布局 ， 以 及 关于 机 器 的 其 他 实现 细节 。 由 
于 这 个 隔离 层 的 存在 ， 我 们 可 以 编写 安全 健壮 的 代码 并 且 不 加 改动 就 可 以 在 任何 操作 系统 上 
运行 。 

包 unsafe 可 以 让 程序 员 穿 透 这 层 隔 离 去 使 用 一 些 关键 的 但 通过 其 他 方式 无 法 使 用 到 的 
特性 ， 或 者 是 为 了 实现 更 高 的 性 能 。 付 出 的 代价 通常 就 是 程序 的 可 移植 性 和 安全 性 ， 所 以 当 
你 使 用 unsafe 的 时 候 就 得 自己 承担 风险 。 对 于 如 何 使 用 以 及 何 时 使 用 unsafe 包 的 功能 ， 建 
议 参 考 11.5 节 引 用 的 Knuth 对 于 过 早 优化 的 评论 。 大 多 数 程序 员 永 远 都 不 需要 使 用 unsafe 
包 。 当 然 ， 偶 尔 还 是 存在 这 种 情况 ， 其 中 一 些 关键 代码 最 好 还 是 通过 unsafe 来 写 。 如 果 在 
仔细 研究 和 评估 后 确认 unsafe 包 是 最 佳 的 选择 ， 那 么 还 是 尽 可 能 地 限制 在 小 范围 内 使 用 ， 
这 样 大 多 数 的 程序 就 不 会 了 解 它 在 哪里 使 用 。 

从 现在 开始 ， 可 以 将 最 后 两 章 放 到 脑 后 了 。 开 始 写 一 些 Go 程序 ， 避 免 使 用 reflect 和 
unsafe 包 ， 只 在 你 必须 使 用 的 时 候 再 复习 这 两 章 。 

开始 快乐 地 使 用 Go 编程 吧 。 我 们 希望 你 和 我 们 一 样 喜欢 用 Go 来 编程 。 
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